신뢰영역
Confidence region통계에서 신뢰 영역은 신뢰 구간의 다차원 일반화다. 그것은 n차원 공간에 있는 점들의 집합으로, 다른 모양들이 발생할 수 있지만, 문제의 추정 해결책인 점 주위의 타원체로 종종 표현된다.
해석
신뢰 영역은 일련의 측정을 여러 번 반복하고 각 측정 세트에 대해 동일한 방식으로 신뢰 영역을 계산하는 경우 신뢰 영역의 일정 비율(예: 95%)이 추정 변수 집합의 "참" 값을 나타내는 점을 포함하도록 계산된다.단, 사전 확률에 대한 특정 가정을 하지 않는 한, "참" 값의 특정 확률 분포를 가정하지 않고 다른 정보를 가질 수도 있고 그렇지 않을 수도 있으므로, 한 신뢰 영역을 계산했을 때 "참" 값이 영역 내부에 있을 확률이 95%라는 의미는 아니다.그들이 거짓말을 할 것 같은 곳에
동일한 정규 분포를 따르는 독립적 오류의 경우
다음과 같은 지나치게 결정된 문제에 대한 솔루션 을(를) 발견했다고 가정해 보십시오.
여기서 Y는 종속 변수의 관측값을 포함하는 n차원 열 벡터, X는 정확히 알려진 것으로 가정되는 독립 변수(물리적 모델을 나타낼 수 있음)의 관측값의 n-by-p 행렬이며, 은 다음과 같은 parameters를 포함하는 열 벡터다. 추정되며, 은(는 평균이 0인 정규 분포로 독립적으로 분포하고, 각각이 한 알 수 없는 분산을 가정하는 n차원 열 벡터다
의 요소에 대한 공동 100(1 - α) % 신뢰 영역은 다음과 같은 불평등을 만족하는 벡터 b의 값 집합으로 표현된다.[1]
추정 변수의 매개 변수에 변수 b는 자신감 지역에 기초한 지점을 나타내는, p은 수, 벡터 β의 요소들의 즉 수,{\displaystyle{\boldsymbol{\beta}},}β ^{\displaystyle{\boldsymbol{\hat{\beta}}}}은 벡터, 그리고 s2는 감소된 불편 추정치 카이 제곱이다. of 2
또한 F는 F-분포의 정량 함수로서 p와 = - p = n - 자유도 , }}은 통계적 유의 수준이며 X {\ X의 전치를 의미한다
이 표현은 다음과 같이 다시 쓸 수 있다.
where is the least-squares scaled covariance matrix of .
위의 불평등은 p-차원 데카르트 매개변수 공간 R에서p 타원체 영역을 정의한다. 타원체 중심은 추정치 프레스 외 에 따르면 단수치 분해 후 타원체를 플롯하는 것이 더 쉽다. 타원체 축의 길이는 대각 행렬의 대각선 상에 있는 값의 왕복에 비례하며, 이들 축의 방향은 분해의 세 번째 행렬의 행에 의해 주어진다.
가중 및 일반화 최소 제곱
이제 의 일부 구별되는 요소에서 0이 아닌 공분산(즉, 관측치의 오차가 독립적으로 분포되지 않음)을 알았거나 오류의 표준 편차가 모두 같지 않은 더 일반적인 경우를 고려해 보십시오. Suppose the covariance matrix of is , where V is an n-by-n nonsingular matrix which was equal to in the more specific case handled in the previous section, (where I is the identity matrix,) b여기서 ut는 모든 대각선 원소가 반드시 동일하지는 않을 뿐 아니라 개별 관측치 쌍의 공분산을 나타내는 0이 아닌 비-영점 관측 원소를 갖는 것이 허용된다.
다음과 같은 비정규 대칭 행렬 P를[2] 찾을 수 있다.
사실상 P는 공분산 행렬 V의 제곱근이다.
최소 제곱 문제
그런 다음 각 항을 P의 역순으로 좌-다중화하여 새로운 문제 제식을 형성함으로써 변환될 수 있다.
어디에
- = P- 및
매개변수에 대한 공동 신뢰 영역(예: 은 다음에 의해 주어진 타원체로 경계된다.[3]
여기서 F는 F 분포의 백분율 포인트를 나타내며, p와 n-p의 양은 이 분포의 매개변수인 자유도다.
비선형 문제
신뢰 영역은 모든 확률 분포에 대해 정의할 수 있다. 실험자는 유의 수준과 지역의 형상을 선택할 수 있으며, 그 다음 지역의 크기는 확률 분포에 의해 결정된다. 자연스러운 선택은 일정한 }}(chi-squared) 값을 갖는 점 집합을 경계로 사용하는 것이다.
한 가지 접근방식은 비선형 모델에 대한 선형 근사치를 사용하는 것으로, 이는 솔루션 주변에서 가까운 근사치일 수 있다. 그리고 선형 문제에 대한 분석을 적용하여 근사 신뢰 영역을 찾는 것이다. 신뢰 영역이 그리 크지 않고 모형의 두 번째 파생상품도 그리 크지 않다면 이는 합리적인 접근법일 수 있다.
관련 개념은 불확실성 정량화 방법론을 참조한다.화 방법론을 참조하십시오.
참고 항목
메모들
![]() |
참조
- Draper, N.R.; H. Smith (1981) [1966]. Applied Regression Analysis (2nd ed.). USA: John Wiley and Sons Ltd. ISBN 0-471-02995-5.
- Press, W.H.; S.A. Teukolsky; W.T. Vetterling; B.P. Flannery (1992) [1988]. Numerical Recipes in C: The Art of Scientific Computing (2nd ed.). Cambridge UK: Cambridge University Press.