이산 확률 분포
- 일반적으로 통계 모형에서 사용되는 확률 분포는 확률 함수에 의해 결정되는데, 이 때 확률 함수를 살펴보면 특정한 숫자에 의해 동일한 유형으로 나타난다.
- 특히 이산 확률 변수의 확률 분포를 이산 확률 분포라 한다.
베르누이 분포(Bernoulli Distribution)
- 동전 던지기의 앞면과 뒷면, 생산한 제품의 양호와 불량, 그리고 설문조사의 YES와 NO 등과 같이 실험 결과가 2가지인 확률 실험을 베르누이 실험(Bernoulli Experiment)이라 한다.
- 이 실험에서 관심의 대상이 되는 실험 결과를 성공, 그렇지 않은 결과를 실패라 하고, 성공의 확률 pp 를 성공률(Rate of Success)이라 한다.
예
- 주사위를 던져서 1의 눈이 나오는 게임을 한다면, 관심의 대상은 1의 눈이고, 성공률은 1616 이다.
- 주사위를 던져서 1의 눈이 나오면(성공) 확률 변수 X=1X=1, 다른 눈이 나오면(실패) X=0X=0 이라 하자.
- 그러면 확률 변수 XX 의 확률 질량 함수는 다음과 같다.
f(x)={56,x=016,x=10,otherwisef(x)=⎧⎪⎨⎪⎩56,x=016,x=10,otherwise |
- 이처럼 성공률이 pp 인 베르누이 실험에서 성공이면 X=1X=1, 실패이면 X=0X=0 이라 할 때, 확률 변수 XX 의 확률 분포를 모수 pp 인 베르누이 분포(Bernoulli Distribution)라 한다.
- 이 때, XX 의 확률 질량 함수를 나타내면 다음과 같다.
f(x)={1−p,x=0p,x=10,otherwisef(x)=⎧⎨⎩1−p,x=0p,x=10,otherwise
- 특히 성공률 pp 인 베르누이 실험을 독립적으로 반복하여 실행하는 과정을 베르누이 실행(Bernoulli Trial)이라 한다.
- 확률 변수 XX 가 모수 pp 인 베르누이 분포를 따른다면, XX 와 X2X2 의 평균은 각각 다음과 같다.
E(X)=(1−p)×0+p×1=pE(X2)=(1−p)×02+p×12=pE(X)=(1−p)×0+p×1=pE(X2)=(1−p)×02+p×12=p
- 따라서 XX 의 분산은 σ2=E(X2)−{E(X)}2=p−p2=p(1−p)σ2=E(X2)−{E(X)}2=p−p2=p(1−p) 이다.
① XX 의 평균 : μ=pμ=p
② XX 의 분산 : σ2=p(1−p)σ2=p(1−p)
예제 : 주사위를 던져서 5 또는 6의 눈이 나오면 X=1X=1, 다른 눈이 나오면 X=0X=0 이라 할 때, 확률 변수 XX 의 확률 질량 함수 f(x)f(x) 와 XX 의 평균과 분산을 구하라.
주사위를 던져서 5 또는 6의 눈이 나올 확률은 p=13p=13 이고, 다른 눈이 나올 확률은 1−p=231−p=23 이므로, P(X=0)=23,P(X=1)=13P(X=0)=23,P(X=1)=13 이다. 따라서 XX 의 확률 질량 함수는 다음과 같다.
f(x)={23,x=013,x=10,otherwisef(x)=⎧⎪⎨⎪⎩23,x=013,x=10,otherwise
그리고 XX 의 평균은 μ=13μ=13, 분산은 σ2=13×23=29σ2=13×23=29 이다.
이항 분포(Binomial Distribution)
매회 성공률이 pp 인 베르누이 실험을 독립적으로 nn 번 반복할 때, 성공한 횟수(XX)의 확률 분포를 모수 nn 과 pp 인 이항 분포(Binomial Distribution)라 하고, X∼B(n,p)X∼B(n,p) 로 나타낸다.
예
- 주사위를 네 번 던지는 게임에서 1의 눈이 나온 횟수를 생각해보자.
- 매 시행에서 1의 눈이 나오면 SS, 다른 눈이 나오면 FF 라 하면 표본 공간은 다음과 같다.
{SSSS,SSSF,SSFS,SFSS,SSFF,SFSF,SFFFS,SFFFFSSS,FSSF,FSFS,FFSS,FSFF,FFSF,FFFS,FFFF}{SSSS,SSSF,SSFS,SFSS,SSFF,SFSF,SFFFS,SFFFFSSS,FSSF,FSFS,FFSS,FSFF,FFSF,FFFS,FFFF} |
- 주사위를 던지는 게임은 독립 시행이므로 시행에서 성공률은 P(S)=16P(S)=16, 실패율은 P(F)=56P(F)=56 이다.
- 이 때, 꼭 한 번 성공하는 사건은 A={SFFF,FSFF,FFSF,FFFS}A={SFFF,FSFF,FFSF,FFFS} 이고, 각 표본점에 대응하는 확률은 16(56)316(56)3 이다.
- 그러므로 주사위를 네 번 던지는 게임에서 확률 변수 XX 를 성공 횟수라 하면, X=1X=1 인 확률은 다음과 같다.
P(X=1)=4×16(56)3=4C116(56)3P(X=1)=4×16(56)3=4C116(56)3 |
- 그리고 P(X=1)P(X=1) 은 다음과 같은 구조를 갖는다.

- 따라서 4번의 시행 중에서 성공한 횟수를 나타내는 확률 변수 XX 가 취할 수 있는 값은 0, 1, 2, 3, 4 이고, 다음과 같은 확률의 구조를 얻는다.
P(X=x)=4Cx(16)x(56)4−x,x=0,1,2,3,4P(X=x)=4Cx(16)x(56)4−x,x=0,1,2,3,4 |
매회 성공률이 pp 인 베르누이 시행을 nn 번 독립적으로 반복하여 성공한 횟수에 대한 확률
- 일반적으로 매회 성공률이 pp 인 베르누이 시행을 nn 번 독립적으로 반복하여 성공한 횟수를 확률 변수 XX 라 하자.
- 이 때, nn 번의 시행 중에서 xx 번 성공하는 경우의 수는 nCx=n!x!(n−x)!nCx=n!x!(n−x)! 이고, 독립 시행이므로 xx 번 성공하는 경우의 각 경우의 확률은 px(1−p)n−xpx(1−p)n−x 이다.
- 따라서 매회 성공률이 pp 인 베르누이 시행을 nn 번 독립적으로 반복하여 성공한 횟수에 대한 확률은 다음과 같다.
P(X=x)=nCxpx(1−p)n−x,x=0,1,2,⋯,nP(X=x)=nCxpx(1−p)n−x,x=0,1,2,⋯,n
- 그리고 모수 nn 과 pp 인 이항 분포의 확률 질량 함수는 다음과 같다.
f(x)={nCxpxqn−x,x=0,1,2,⋯,n,q=1−p0,otherwisef(x)={nCxpxqn−x,x=0,1,2,⋯,n,q=1−p0,otherwise
이항 분포(B(n,p)B(n,p))의 그래프
- 이항 분포 B(n,p)B(n,p) 의 그래프는 다음과 같다.
nn 에 따른 이항 분포의 그래프 | pp 에 따른 이항 분포의 그래프 |
![]() |
![]() |
- pp 가 일정하고 nn 이 커지면 이항 분포는 종 모양의 좌우 대칭형에 가까워진다.
- p<0.5p<0.5 이면 이항 분포는 왼쪽으로 치우치고, 오른쪽으로 긴 꼬리 모양을 가지는 양의 비대칭인 분포를 이룬다.
- p>0.5p>0.5 이면 이항 분포는 오른쪽으로 치우치고 왼쪽으로 긴 꼬리 모양을 가지는 음의 비대칭인 분포를 이룬다.
- p=0.5p=0.5 이면 nn 에 관계 없이 μ=n2μ=n2 을 중심으로 좌우 대칭이다.
- 이 경우를 대칭 이항 분포(Symmetric Binomial Distribution)라 한다.
이항 분포에 따르는 확률 변수 XX 의 평균과 분산
- 매회 성공률이 pp 인 베르누이 시행을 nn 번 독립적으로 반복하여 ii 번째 시행에서 성공이면 Xi=1Xi=1 실패이면 Xi=0Xi=0 이라 하자.
- 그러면 E(Xi)=p,Var(Xi)=p(1−p),i=1,2,⋯,nE(Xi)=p,Var(Xi)=p(1−p),i=1,2,⋯,n 이다.
- 이 때, 각 확률 변수 XiXi 가 취하는 값은 0과 1뿐이므로 X=X1+X2+⋯+XnX=X1+X2+⋯+Xn 이 취할 수 있는 값은 0,1,2,⋯,n0,1,2,⋯,n 이다.
- 그리고 확률 변수 XX 는 nn 번 독립적으로 반복 시행한 베르누이 시행에서 성공한 횟수를 나타낸다.
- 즉 XX 는 모수 nn 과 pp 인 이항 분포의 확률 변수는 독립인 베르누이 확률 변수들의 합과 같다.
- 따라서 이항 분포에 따르는 확률 변수 XX 의 평균과 분산은 다음과 같다.
μ=E(X1+X2+⋯+Xn)=E(X1)+E(X2)+⋯+E(Xn)=p+p+⋯+p=npμ=E(X1+X2+⋯+Xn)=E(X1)+E(X2)+⋯+E(Xn)=p+p+⋯+p=np
σ2=Var(X1+X2+⋯+Xn)=Var(X1)+Var(X2)+⋯+Var(Xn)=p(1−p)+p(1−p)+⋯+p(1−p)=np(1−p)σ2=Var(X1+X2+⋯+Xn)=Var(X1)+Var(X2)+⋯+Var(Xn)=p(1−p)+p(1−p)+⋯+p(1−p)=np(1−p)
- 즉, X∼B(n,p) 의 평균과 분산은 각각 다음과 같다.
① 평균 : μ=np
② 분산 : σ2=npq,q=1−p
예제 : 4지선다형으로 주어진 5문제에서 임의로 답을 선택할 때, 정답을 선택한 문제 수를 확률 변수 X 라 한다. 이 때, X 의 확률 질량 함수 f(x) 와 X 의 평균과 분산을 구하라.
각 문제당 정답을 선택할 확률은 0.25이고, 정답을 선택하는 것은 독립 시행이므로 확률 변수 X 는 모수 n=5,p=0.25 인 이항 분포를 따른다.
따라서 X 의 확률 질량 함수는 다음과 같다.
f(x)={5Cx(0.25)x(0.75)5−x,x=0,1,2,3,4,50,otherwise
그리고 X 의 평균과 분산은 각각 μ=5×0.25=1.25,σ2=5×0.25×0.75=0.9375 이다.
이항 분포와 확률
- 특히 모수 n=1 과 p 인 이항 분포는 모수 p 인 베르누이 분포와 일치한다.
- 그리고 X∼B(n,p) 일 때, a=0,1,⋯,n 에 대해 다음과 같이 확률을 계산할 수 있다.
① P(X=a)=P(X≤a)−P(X≤a−1)
② P(a<X≤b)=P(X≤b)−P(X≤a)
③ P(X>a)=1−P(X≤a)
예제 : 4지선다형으로 주어진 5문제에서 임의로 답을 선택할 때, 정답을 선택한 문제 수를 확률 변수 X 라 한다. 이 때, 다음 확률을 구하라. (단, 소숫점 이하 다섯째 자리에서 반올림한다.)
(a) P(X≤1)
(b) P(X=2)
(c) P(X<3)
(d) P(X>3)
x=0,1,⋯,5 에 대해 f(x)=5Cx(0.25)x(0.75)5−x 이므로 구하고자 하는 확률은 다음과 같다.
(a)
P(X≤1)=f(0)+f(1)=5C0(0.75)5+5C1(0.25)1(0.75)4≒0.2373+0.3955=0.6328
(b)
P(X=2)=f(2)=5C2(0.25)2(0.75)3≒0.2367
(c)
P(X<3)=P(X≤2)=f(0)+f(1)+f(2)≒0.8965
(d)
P(X>3)=P(X≥4)=f(4)+f(5)=5C4(0.25)4(0.75)1+5C5(0.25)5(0.75)0≒0.0146+0.001=0.0156
이항 분포의 확률 계산 (이항 누적 확률표 이용)
- 이항 분포에 대한 확률은 이항 누적 확률표(Cumulative Binomial Distribution Table)를 이용하여 쉽게 구할 수 있다.
- 예를 들어, X∼B(8,0.45) 일 때 P(X≤4) 는 이항 누적 확률표를 이용하여 다음과 같이 구한다.
① 좌측 열에서 n 이 8인 부분을 선정한다. ② 상단에서 p 가 0.45인 열을 선택한다. ③ 좌측열에서 x 가 4인 행을 선택한다. ④ x 가 4인 행과 p 가 0.5인 열이 만나는 위치의 수 0.7396을 선택한다. ⑤ P(X≤4)=0.7396 이다. |

이항 누적 확률표(Cumulative Binomial Distribution Table)
이항 분포의 합성
- X 와 Y 가 독립이고, X∼B(m,p),Y∼B(n,p) 라 하면, X+Y∼B(m+n,p) 가 성립한다.
- 일반적으로 독립인 이항 분포를 따르는 확률 변수 Xi∼B(ni,p),i=1,2,⋯,k 에 대해 다음이 성립한다.
X∼B(n,p),단,X=k∑i=1Xi,n=k∑i=1ni
예제 : 이항 분포를 따르는 독립인 두 확률 변수 X∼B(3,0.25) 와 Y∼B(5,0.25) 에 대해 이항 누적 확률표를 이용하여 다음 확률을 구하라.
(a) P(X+Y≤4)
(b) P(X+Y=4)
(c) P(X+Y≥4)
X∼B(3,0.25) 와 Y∼B(5,0.25) 이고, X 와 Y 가 독립이므로 X+Y∼B(8,0.25) 이다.
따라서 이항 누적 확률표로부터 다음을 얻는다.
(a)
P(X+Y≤4)=0.9727
(b)
P(X+Y=4)=P(X+Y≤4)−P(X+Y≤3)=0.9727−0.8862=0.0865
(c)
P(X+Y≥4)=1−P(X+Y≤3)=1−0.8862=0.1138
'Mathematics > 확률과 통계' 카테고리의 다른 글
[확률과 통계] 모비율의 추정 (0) | 2022.11.28 |
---|---|
[확률과 통계] 모평균의 추정 (0) | 2022.11.27 |
[확률과 통계] 모집단과 표본 (0) | 2022.11.21 |
[확률과 통계] 연속 확률 분포 (0) | 2022.11.21 |
[확률과 통계] 확률 변수의 평균과 분산 (0) | 2022.11.14 |
[확률과 통계] 연속 확률 변수 (0) | 2022.11.14 |
[확률과 통계] 이산 확률 변수 (0) | 2022.11.07 |
[확률과 통계] 베이즈 정리 (0) | 2022.10.31 |