공동확률분포
Joint probability distribution통계에 관한 시리즈의 일부 |
확률론 |
---|
동일한 확률 [1]공간에 정의된 두 개의 랜덤 변수가 주어진 경우, 결합 확률 분포는 가능한 모든 출력 쌍에 대한 해당 확률 분포입니다.주어진 개수의 랜덤 변수에 대해서도 결합 분포를 고려할 수 있습니다.공동 분포는 주변 분포, 즉 개별 랜덤 변수의 분포를 부호화합니다.또한 조건부 확률 분포를 부호화하며, 이는 다른 랜덤 변수의 출력에 대한 정보가 주어졌을 때 한 랜덤 변수의 출력이 어떻게 분포되는지를 다룬다.
측정 이론의 공식적 수학적 설정에서, 관절 분포는 표본 공간의 확률 측정의 주어진 랜덤 변수를 조합하여 얻은 지도에 의해 푸시포워드 측정으로 주어진다.
실수값 랜덤 변수의 경우, 특정 다변량 분포로서의 결합 분포는 다변량 누적 분포 함수 또는 다변량 확률 질량 함수와 함께 다변량 확률 밀도 함수로 표현될 수 있습니다.연속 랜덤 변수의 특수한 경우에는 확률 밀도 함수를 고려하는 것으로 충분하고 이산 랜덤 변수의 경우에는 확률 질량 함수를 고려하는 것으로 충분하다.
예
항아리에서 뽑다
두 개의 항아리 각각에 파란색 공보다 두 배 많은 빨간색 공이 들어 있고 다른 공은 들어 있지 않다고 가정하고, 각 항아리에서 두 개의 추첨이 서로 독립적으로 랜덤하게 선택된다고 가정합니다.A A와 B B를 각각 첫 번째 항아리 및 두 번째 항아리 추첨 결과와 관련된 이산 랜덤 변수라고 합니다.두 항아리 중 하나에서 빨간색 공을 그릴 확률은 2/3이고 파란색 공을 그릴 확률은 1/3입니다.합동 확률 분포는 다음 표에 나와 있습니다.
A=빨간색 | A=파랑 | P(B) | |
---|---|---|---|
B=빨간색 | (2/3)(2/3)=4/9 | (1/3)(2/3)=2/9 | 4/9+2/9=2/3 |
B=파랑 | (2/3)(1/3)=2/9 | (1/3)(1/3)=1/9 | 2/9+1/9=1/3 |
P(A) | 4/9+2/9=2/3 | 2/9+1/9=1/3 |
4개의 내부 셀 각각은 2개의 추첨에서 결과의 특정 조합의 확률을 나타냅니다. 이러한 확률은 공동 분포입니다.하나의 셀에서 특정 조합이 발생할 확률은 (추첨이 독립적이기 때문에) A에 대한 특정 결과의 확률과 B에 대한 특정 결과의 확률의 곱이다.이 네 셀의 확률은 확률 분포의 경우 항상 참이므로 합계가 1이 됩니다.
또한 마지막 행과 마지막 열은 각각 A에 대한 한계 확률 분포와 B에 대한 한계 확률 분포를 제공합니다.예를 들어 A의 경우, 이들 셀 중 첫 번째 셀은 A가 빨간색일 확률의 합계를 2/3로 제공합니다.따라서 확률 분포는 A의이표의 여백에 있는에 무조건적으로 부여됩니다.
동전 던지기
두 개의 페어 코인의 플립을 고려합니다. A A와 B B는 각각 첫 번째 및 두 번째 코인의 플립 결과와 관련된 이산 랜덤 입니다.각각의 동전 던지기는 베르누이의 시도이며 베르누이의 분포를 가지고 있습니다.동전이 "앞면"을 표시하면 연관된 랜덤 변수는 값 1을 사용하고, 그렇지 않으면 값 0을 사용합니다.각 결과의 확률은 1/2이므로 한계(무조건) 밀도 함수는 다음과 같습니다.
A 스타일 A와 B B의 공동 확률 질량 함수는 각 결과 쌍에 대한 확률을 정의합니다.가능한 모든 결과는 다음과 같습니다.
각 결과가 같기 때문에 결합 확률 질량 함수는
코인 플립은 독립적이므로, 결합 확률 질량 함수는 한계값의 곱이다.
주사위 굴리기
공정한 주사위의 롤을 고려하여 숫자가 짝수인 경우 A : 2, 4, 또는 6), 않은 경우 A (\ A으로 .또한 숫자가 소수(예: 2, , 5이면 B = 1 {display B}, 않으면 B =0 {style 으로 .
1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|
A | 0 | 1 | 0 | 1 | 0 | 1 |
B | 0 | 1 | 1 | 0 | 1 | 0 |
다음으로 확률질량함수로 표현되는 A A와 B B의 합동분포는
A디스플레이 스타일 와 B B의 조합이 발생할 확률은 1이므로 이러한 확률은 반드시 1이 됩니다.
한계 확률 분포
랜덤 실험에서 두 개 이상의 랜덤 변수가 정의된 경우 X와 Y의 결합 확률 분포와 각 변수의 확률 분포를 개별적으로 구별하는 것이 중요합니다.랜덤 변수의 개별 확률 분포를 한계 확률 분포라고 합니다.일반적으로 X의 한계 확률 분포는 X와 기타 랜덤 변수의 합동 확률 분포에서 확인할 수 있습니다.
랜덤 변수 X와 Y의 결합 확률 밀도 함수가 f )인 , 한계 분포를 정의하는 X와 Y의 한계 밀도 함수는 다음과 같습니다.
여기서 첫 번째 적분은 X=x 범위의 모든 점 위에 있고 두 번째 적분은 Y=y [2]범위의 모든 점 위에 있습니다.
공동누적분포함수
랜덤 X X 쌍에 대해 공동 누적 분포 함수CDF) X Y(\ F_)은[3]: p. 89 (는)
| (제1호) |
여기서 오른쪽은 랜덤 X(\ X가 x x보다 작거나 같은 값을 취하고 Y(\ Y가y y보다 작거나 같은 값을 취할 확률을 나타냅니다.
N N 랜덤 X, 공동 …, (\ F_},\X_은 과 같습니다.
| (제2호) |
N 랜덤 변수를 랜덤 X ( ,… , N )(\ =(T은(는) 보다 짧은 표기를 나타냅니다.
개별 케이스
두 개의 이산 랜덤 X(\ X의 공동 확률 질량 함수는 다음과 같습니다.
| (제3호) |
또는 조건부 분포의 관점에서 작성됩니다.
서 P X X는 X {\ X일 때 Y 의 입니다.
위의 2가지 변수의 일반화는 n개의{\ n의 이산 랜덤 ,, \의 공동 확률 분포입니다.
| (제4호) |
또는 동등하게
이 동일성은 확률의 연쇄 법칙으로 알려져 있습니다.
이것은 확률이기 때문에 두 변수의 경우
n개의 n의 이산 랜덤 X2 X_ \, 에 일반화되어 있습니다.
연속 케이스
두 개의 연속 랜덤 변수에 대한 합동 확률 밀도 f , ( ,) {는 합동 누적 분포 함수의 도함수로 정의된다(Eq.1 참조).
| (제5호) |
이는 다음과 같습니다.
서 f Y ( yx) { f { \ X} (\ X ) } X ( x \ mid Y ) f _ { \ Y} ( \ Y ) x style = X style의 분포입니다. {displaystyle 및 Y {는 각각X(\ X Y(\ Y의 한계 분포입니다.
두 의 랜덤 변수, 즉 '무작위 변수'로됩니다.
| (제6호) |
에 ' '다음에', '다음에', '다음에', '다음에', '다음에', '다음에',
대소문자가
"혼합 접합 밀도"는 하나 이상의 랜덤 변수가 연속형이고 다른 랜덤 변수가 이산형인 경우에 정의할 수 있다. .
연속적으로 하는 결과의 값에 따라 이항 결과의 확률을 예측하기 위해 로지스틱 회귀 분석을 사용하고자 할 때 발생하는 한 랜덤 변수의 누적 분포를 찾고자 하는 상황의 한 예X {\ X 입력 변수 , 는 초기에 확률 밀도 함수 또는 확률 질량 함수를 일괄적으로 할당할 수 없는 방식으로 정의되었기 때문에 이 이항 결과의 누적 분포를 찾을 때 "혼합" 관절 밀도를 사용해야 한다으로 f, ( ,) ( \ _ { , Y } ( , )는X 의 서포트에서의 제품 측정치에 대한 (의확률 밀도 함수입니다.이 두 가지 분해 중 하나를 사용하여 복구할 수 있습니다.누적 분포 함수:
이 정의는 이산형 랜덤 변수와 연속형 랜덤 변수의 임의 개수의 혼합으로 일반화됩니다.
기타 속성
독립 변수에 대한 공동 분포
일반적으로 두 개의 랜덤 XX)와 Y(\ Y는 합동 누적 분포 함수가 다음을 만족하는 경우에만 독립적입니다.
두 개의 이산 랜덤 X(\ X와Y(\ Y는 결합 확률 질량 함수가 다음을 만족하는 경우에만 독립적입니다.
모든 스타일 및 y y에 적용됩니다.
독립 랜덤 사건의 수는 증가하는 반면, 음의 지수 법칙에 따라 관련 공동 확률 값은 0으로 빠르게 감소합니다.
마찬가지로, 절대적으로 연속되는 두 개의 랜덤 변수는 다음과 같은 경우에만 독립적입니다.
모든 스타일 및 y y에 적용됩니다.즉, 하나 이상의 랜덤 변수 값에 대한 정보를 얻으면 조건 없는(마진) 분포와 동일한 다른 변수의 조건부 분포가 발생하므로 다른 변수에 대한 정보를 제공하는 변수는 없습니다.
조건 종속 변수에 대한 공동 분포
의 서브셋AB가 조건부로 종속되어 경우, 관절분포의 확률질량함수는 style 입니다., \, X {n} ( X, , ){ \ {} ( _ {1} , \,_ { } )는( B )( P ( b P ( A ) \ P ( A ) \ cdot P ( A ) \ B )따라서 저차원 P {)} P(B) {B로 효율적으로 나타낼 수 있으며, 이러한 조건부 독립관계는 베이지안 네트워크 또는 코풀라 함수로 나타낼 수 있다.
공분산
확률 공간에 두 개 이상의 랜덤 변수가 정의되어 있는 경우 변수 간의 관계를 측정하는 데 유용합니다.두 랜덤 변수 간의 관계에 대한 일반적인 측도는 공분산입니다.공분산은 랜덤 변수 간의 선형 관계에 대한 측도입니다.랜덤 변수 간의 관계가 비선형인 경우 공분산은 관계에 민감하지 않을 수 있습니다. 즉, 두 변수 간의 상관 관계가 없습니다.
랜덤 변수 X와 Y 사이의 공분산은 cov(X,Y)로 표시됩니다.
상관 관계
종종 공분산보다 해석하기 쉬운 두 랜덤 변수 간의 관계에 대한 또 다른 측도가 있습니다.
상관 관계에서는 각 변수의 표준 편차의 곱에 따라 공분산을 척도화합니다.따라서 상관 관계는 서로 다른 단위의 변수 쌍 간의 선형 관계를 비교하는 데 사용할 수 있는 무차원 양입니다.양의 확률을 받는 X와 Y의 결합 확률 분포에서 점들이 양(또는 음) 기울기의 선을 따라 떨어지는 경향이 있으면 θ는XY +1(또는 -1)에 가깝습니다.θ가XY +1 또는 -1이면 양수 확률을 받는 접합 확률 분포의 점이 정확히 직선을 따라 떨어진다는 것을 알 수 있습니다.상관 관계가 0이 아닌 두 랜덤 변수는 상관 관계가 있다고 합니다.공분산과 마찬가지로 상관 관계는 랜덤 변수 간의 선형 관계에 대한 측도입니다.
랜덤 변수 X와 Y 사이의 상관관계로, 다음과 같이 표시됩니다.
중요한 명명된 분포
통계에서 자주 발생하는 명명된 결합 분포에는 다변량 정규 분포, 다변량 안정 분포, 다항 분포, 음수 다항 분포, 다변량 고기하 분포 및 타원 분포가 포함됩니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Feller, William (1957). An introduction to probability theory and its applications, vol 1, 3rd edition. pp. 217–218. ISBN 978-0471257080.
- ^ Montgomery, Douglas C. (19 November 2013). Applied statistics and probability for engineers. Runger, George C. (Sixth ed.). Hoboken, NJ. ISBN 978-1-118-53971-2. OCLC 861273897.
- ^ Park,Kun Il (2018). Fundamentals of Probability and Stochastic Processes with Applications to Communications. Springer. ISBN 978-3-319-68074-3.
- ^ Montgomery, Douglas C. (19 November 2013). Applied statistics and probability for engineers. Runger, George C. (Sixth ed.). Hoboken, NJ. ISBN 978-1-118-53971-2. OCLC 861273897.
외부 링크
- "Joint distribution", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
- "Multi-dimensional distribution", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
- 확률과 통계의 현대적 입문: 그 이유와 방법을 이해합니다.데킹, 미셸, 1946-런던: 스프링거.2005. ISBN 978-1-85233-896-1.OCLC 262680588
- "Joint continuous density function". PlanetMath.
- Mathworld: 공동 분배 함수