피셔의 방법
Fisher's method
통계에서 피셔의 결합 확률 시험이라고도 하는 [1][2]피셔의 방법은 데이터 융합이나 "메타 분석"(분석 분석)을 위한 기법이다.그것은 로널드 피셔에 의해 개발되었고 이름을 붙였다.그것의 기본 형태에서, 그것은 동일한 전체 가설 (H0)에 의거한 여러 독립성 시험의 결과를 결합하는 데 사용된다.
독립적 시험 통계에 적용
Fisher의 방법은 공식을 사용하여 일반적으로 "p-값"으로 알려진 각 검정의 극단값 확률을 하나의 검정 통계량(X2)으로 결합한다.
여기서 p는i i 가설th 검정의 p-값이다.p-값이 작은 경향이 있는 경우 검정 통계량 X가2 크므로 모든 검정에 대해 귀무 가설은 참이 아님을 알 수 있다.
모든 귀무 가설이 참이고 pi(또는 그에 상응하는 시험 통계량)가 독립적일 때 X는2 자유도가 2k인 카이 제곱 분포를 가지며 여기서 k는 결합되는 시험의 수입니다.이 사실은 X에2 대한 p-값을 결정하는 데 사용될 수 있다.
X2 분포는 다음과 같은 이유로 카이-제곱 분포로, 검정 i에 대한 귀무 가설에서 p-값 p는i [0,1] 구간에서 균일한 분포를 따른다.등분포 값의 음수 로그는 지수 분포를 따른다.지수 분포를 따르는 값을 2의 인수로 스케일링하면 자유도가 2인 카이 제곱 분포를 따르는 수량이 산출된다.마지막으로, 각각 자유도가 2인 k 독립적인 카이-제곱 값의 합은 자유도가 2k인 카이-제곱 분포를 따른다.
독립성 가정 한계
통계적 시험 사이의 의존성은 일반적으로[vague] 양성으로, 의존성을 고려하지 않으면 X의2 p-값이 너무 작다는 것을 의미한다(반보수적).따라서 피셔의 독립적 시험 방법을 종속적 설정으로 적용하고, p-값이 귀무 가설을 기각할 정도로 작지 않다면, 의존성이 적절하게 설명되지 않더라도 그러한 결론은 계속 유지될 것이다.그러나 양의존성이 설명되지 않고 메타분석 p-값이 작은 것으로 확인되면 일반적으로 귀무 가설에 대한 증거가 과대평가된다.k 독립 또는 양의 상관 관계 테스트에 대해 감소된 평균 거짓 발견률 + )/( 2 ) 은(는) 피셔 X의2 지나치게 작은 p-값과 유용한 비교를 위해 알파 제어하기에 충분할 수 있다.
종속 테스트 통계량에 대한 확장
시험이 독립적이지 않은 경우에는 X의2 null 분포가 더 복잡하다.일반적인 전략은 크기가 조정된 χ-분포2 랜덤 변수를 사용하여 null 분포를 근사화하는 것이다.다른 p-값 사이의 공분산을 알 수 있는지 여부에 따라 다른 접근법을 사용할 수 있다.
브라운의 방법은[3] 기초 검정 통계량이 다변량 정규 분포를 갖는 종속 p-값을 알려진 공분산 행렬과 결합하는 데 사용할 수 있다.코스트의 방법은[4] 공분산 행렬이 스칼라 승법인자까지만 알려진 경우 p-값을 결합할 수 있도록 브라운을 확장한다.
조화 평균 p-값은 의존성 구조를 알 수 없지만 시험이 독립적이라고 가정할 수 없을 때 p-값을 결합하는 피셔의 방법에 대한 대안을 제공한다.[5][6]
해석
피셔의 방법은 일반적으로 동일한 귀무 가설을 갖는 개별 연구로부터 독립된 시험 통계수집에 적용된다.메타분석 귀무 가설은 분리된 귀무 가설들이 모두 참이라는 것이다.메타분석 대립 가설은 적어도 하나의 개별 대립 가설은 사실이라는 것이다.
어떤 환경에서는 귀무 가설이 일부 연구에서는 유지되지만 다른 연구에서는 유지되지 않는 '히터질성'의 가능성을 고려하거나, 다른 연구에서는 서로 다른 대립 가설들이 존재할 수 있는 경우를 고려하는 것이 타당하다.이질성의 후자의 형태에 대한 일반적인 이유는 효과 크기가 모집단마다 다를 수 있기 때문이다.예를 들어, 제2형 당뇨병의 발병에 대한 고당도 식단의 위험을 살펴보는 의학 연구의 모음을 생각해 보자.유전적 또는 환경적 요인에 의해, 주어진 수준의 포도당 소비와 관련된 진정한 위험은 일부 인구에서 다른 인구보다 더 클 수 있다.
다른 설정에서, 대립 가설은 보편적으로 거짓이거나 또는 보편적으로 참이다. - 어떤 설정에서는 유지될 가능성이 없지만 다른 설정에서는 그렇지 않다.예를 들어 특정 물리적 법칙을 테스트하기 위해 설계된 여러 실험을 생각해 보십시오.별도의 연구나 실험의 결과들 사이에 불일치는 반드시 우연에 기인해야 하며, 힘의 차이로 기인할 수도 있다.
양면시험을 이용한 메타분석의 경우 개별 연구가 서로 다른 방향으로 강한 효과를 보여도 메타분석 귀무 가설을 기각할 수 있다.이 경우 우리는 귀무 가설은 모든 연구에서 사실이라는 가설을 거부하고 있지만, 이것이 모든 연구에 걸쳐 존재하는 균일한 대립 가설이라는 것을 의미하지는 않는다.따라서 양면 메타분석은 특히 대립 가설의 이질성에 민감하다.편측 메타 분석은 효과 규모의 이질성을 탐지할 수 있지만 사전 지정된 단일 효과 방향에 초점을 맞춘다.
스토퍼의 Z-점수법과의 관계
피셔의 방법과 밀접하게 관련된 접근방식은 p-값이 아닌 Z-점수에 기초한 스토퍼의 Z로 연구 가중치를 통합할 수 있다.그것은 사회학자 사무엘 A의 이름을 따서 지어졌다. 스투퍼.[7]만약 우리가i Z = ((1-p − 1i), 여기서 φ은 표준적인 정규 누적분포함수인 경우,
전체 메타분석을 위한 Z-점수 입니다.이 Z-점수는 단측 오른쪽 꼬리 p-값에 적합하며, 양측 또는 왼쪽 꼬리 p-값을 분석하는 경우 사소한 수정을 할 수 있다.구체적으로는 양면 p-값을 분석하는 경우에는 양면 p-값(pi/2)을, 왼쪽꼬리 p-값을 사용하는 경우에는 1-p를i 사용한다.[8][unreliable source?]
피셔의 방법은 -log(pi) 값의 평균을 기준으로 하고, Z-점수 방법은 Zi 값의 평균을 기준으로 하기 때문에, 이 두 접근법의 관계는 z와 -log(p) = -log(1-EX(z)의 관계에서 따르게 된다.정규 분포의 경우 이 두 값은 완전히 선형적으로 연관되지는 않지만 1에서 5까지 가장 자주 관측되는 Z 값의 범위에 걸쳐 고도로 선형 관계를 따른다.그 결과 Z점수법의 위력은 피셔의 위력과 거의 동일하다.
Z-점수 접근법의 한 가지 장점은 체중을 도입하는 것이 간단하다는 것이다.[9][10] ith Z-점수에 w가i 가중되면 메타분석 Z-점수는
이는 귀무 가설의 표준 정규 분포를 따른다.피셔 통계량의 가중치 버전은 도출할 수 있지만, null 분포는 독립적인 카이 제곱 통계량의 가중치가 되는 합이 되어 작업하기가 덜 편리하다.
참조
- ^ Fisher, R.A. (1925). Statistical Methods for Research Workers. Oliver and Boyd (Edinburgh). ISBN 0-05-002170-2.
- ^ Fisher, R.A.; Fisher, R. A (1948). "Questions and answers #14". The American Statistician. 2 (5): 30–31. doi:10.2307/2681650. JSTOR 2681650.
- ^ Brown, M. (1975). "A method for combining non-independent, one-sided tests of significance". Biometrics. 31 (4): 987–992. doi:10.2307/2529826. JSTOR 2529826.
- ^ Kost, J.; McDermott, M. (2002). "Combining dependent P-values". Statistics & Probability Letters. 60 (2): 183–190. doi:10.1016/S0167-7152(02)00310-3.
- ^ Good, I J (1958). "Significance tests in parallel and in series". Journal of the American Statistical Association. 53 (284): 799–813. doi:10.1080/01621459.1958.10501480. JSTOR 2281953.
- ^ Wilson, D J (2019). "The harmonic mean p-value for combining dependent tests". Proceedings of the National Academy of Sciences USA. 116 (4): 1195–1200. doi:10.1073/pnas.1814092116. PMC 6347718. PMID 30610179.
- ^ Stouffer, S.A.; Suchman, E.A.; DeVinney, L.C.; Star, S.A.; Williams, R.M. Jr. (1949). The American Soldier, Vol.1: Adjustment during Army Life. Princeton University Press, Princeton.
- ^ "Testing two-tailed p-values using Stouffer's approach". stats.stackexchange.com. Retrieved 2015-09-14.
- ^ Mosteller, F.; Bush, R.R. (1954). "Selected quantitative techniques". In Lindzey, G. (ed.). Handbook of Social Psychology,Vol1. Addison_Wesley, Cambridge, Mass. pp. 289–334.
- ^ Liptak, T. (1958). "On the combination of independent tests". Magyar Tud. Akad. Mat. Kutato Int. Kozl. 3: 171–197.
참고 항목
- Fisher 메서드의 확장
- Fisher의 1948년 주석에 대한 대체 출처: [1]
- 피셔스, 스토퍼의 Z-점수, 그리고 몇 가지 관련 방법이 메타프로세서 R 패키지에 구현된다.