728x90
728x90

이산 확률 분포

  • 일반적으로 통계 모형에서 사용되는 확률 분포확률 함수에 의해 결정되는데, 이 때 확률 함수를 살펴보면 특정한 숫자에 의해 동일한 유형으로 나타난다.
  • 특히 이산 확률 변수의 확률 분포이산 확률 분포라 한다.

 

베르누이 분포(Bernoulli Distribution)

  • 동전 던지기의 앞면과 뒷면, 생산한 제품의 양호와 불량, 그리고 설문조사의 YES와 NO 등과 같이 실험 결과가 2가지인 확률 실험베르누이 실험(Bernoulli Experiment)이라 한다.
  • 이 실험에서 관심의 대상이 되는 실험 결과성공, 그렇지 않은 결과실패라 하고, 성공의 확률 pp성공률(Rate of Success)이라 한다.

 

  • 주사위를 던져서 1의 눈이 나오는 게임을 한다면, 관심의 대상은 1의 눈이고, 성공률1616 이다.
  • 주사위를 던져서 1의 눈이 나오면(성공) 확률 변수 X=1X=1, 다른 눈이 나오면(실패) X=0X=0 이라 하자.
  • 그러면 확률 변수 XX확률 질량 함수는 다음과 같다.
f(x)={56,x=016,x=10,otherwisef(x)=56,x=016,x=10,otherwise

 

  • 이처럼 성공률pp베르누이 실험에서 성공이면 X=1X=1, 실패이면 X=0X=0 이라 할 때, 확률 변수 XX확률 분포를 모수 pp베르누이 분포(Bernoulli Distribution)라 한다.
  • 이 때, XX확률 질량 함수를 나타내면 다음과 같다.
f(x)={1p,x=0p,x=10,otherwisef(x)=1p,x=0p,x=10,otherwise
  • 특히 성공률 pp베르누이 실험을 독립적으로 반복하여 실행하는 과정베르누이 실행(Bernoulli Trial)이라 한다.
  • 확률 변수 XX 가 모수 pp베르누이 분포를 따른다면, XXX2X2평균은 각각 다음과 같다.
E(X)=(1p)×0+p×1=pE(X2)=(1p)×02+p×12=pE(X)=(1p)×0+p×1=pE(X2)=(1p)×02+p×12=p
  • 따라서 XX 의 분산은 σ2=E(X2){E(X)}2=pp2=p(1p)σ2=E(X2){E(X)}2=pp2=p(1p) 이다.
XX 의 평균 : μ=pμ=p
XX 의 분산 : σ2=p(1p)σ2=p(1p)

 

예제 : 주사위를 던져서 5 또는 6의 눈이 나오면 X=1X=1, 다른 눈이 나오면 X=0X=0 이라 할 때, 확률 변수 XX 의 확률 질량 함수 f(x)f(x)XX 의 평균과 분산을 구하라.
해설 보기

주사위를 던져서 5 또는 6의 눈이 나올 확률은 p=13p=13 이고, 다른 눈이 나올 확률은 1p=231p=23 이므로, P(X=0)=23,P(X=1)=13P(X=0)=23,P(X=1)=13 이다. 따라서 XX 의 확률 질량 함수는 다음과 같다.

 

f(x)={23,x=013,x=10,otherwisef(x)=23,x=013,x=10,otherwise

 

그리고 XX 의 평균은 μ=13μ=13, 분산은 σ2=13×23=29σ2=13×23=29 이다.

 

이항 분포(Binomial Distribution)

매회 성공률이 pp베르누이 실험을 독립적으로 nn 번 반복할 때, 성공한 횟수(XX)의 확률 분포를 모수 nnpp이항 분포(Binomial Distribution)라 하고, XB(n,p)XB(n,p) 로 나타낸다.

 

  • 주사위를 네 번 던지는 게임에서 1의 눈이 나온 횟수를 생각해보자.
  • 매 시행에서 1의 눈이 나오면 SS, 다른 눈이 나오면 FF 라 하면 표본 공간은 다음과 같다.
{SSSS,SSSF,SSFS,SFSS,SSFF,SFSF,SFFFS,SFFFFSSS,FSSF,FSFS,FFSS,FSFF,FFSF,FFFS,FFFF}{SSSS,SSSF,SSFS,SFSS,SSFF,SFSF,SFFFS,SFFFFSSS,FSSF,FSFS,FFSS,FSFF,FFSF,FFFS,FFFF}
  • 주사위를 던지는 게임은 독립 시행이므로 시행에서 성공률은 P(S)=16P(S)=16, 실패율은 P(F)=56P(F)=56 이다.
  • 이 때, 꼭 한 번 성공하는 사건은 A={SFFF,FSFF,FFSF,FFFS}A={SFFF,FSFF,FFSF,FFFS} 이고, 각 표본점에 대응하는 확률은 16(56)316(56)3 이다.
  • 그러므로 주사위를 네 번 던지는 게임에서 확률 변수 XX 를 성공 횟수라 하면, X=1X=1 인 확률은 다음과 같다.
P(X=1)=4×16(56)3=4C116(56)3P(X=1)=4×16(56)3=4C116(56)3
  • 그리고 P(X=1)P(X=1) 은 다음과 같은 구조를 갖는다.

확률의 구조

  • 따라서 4번의 시행 중에서 성공한 횟수를 나타내는 확률 변수 XX 가 취할 수 있는 값은 0, 1, 2, 3, 4 이고, 다음과 같은 확률의 구조를 얻는다.
P(X=x)=4Cx(16)x(56)4x,x=0,1,2,3,4P(X=x)=4Cx(16)x(56)4x,x=0,1,2,3,4

 

매회 성공률이 pp 인 베르누이 시행을 nn 번 독립적으로 반복하여 성공한 횟수에 대한 확률

  • 일반적으로 매회 성공률이 pp베르누이 시행nn 번 독립적으로 반복하여 성공한 횟수를 확률 변수 XX 라 하자.
  • 이 때, nn 번의 시행 중에서 xx 번 성공하는 경우의 수는 nCx=n!x!(nx)!nCx=n!x!(nx)! 이고, 독립 시행이므로 xx 번 성공하는 경우의 각 경우의 확률은 px(1p)nxpx(1p)nx 이다.
  • 따라서 매회 성공률이 pp베르누이 시행nn 번 독립적으로 반복하여 성공한 횟수에 대한 확률은 다음과 같다.
P(X=x)=nCxpx(1p)nx,x=0,1,2,,nP(X=x)=nCxpx(1p)nx,x=0,1,2,,n
  • 그리고 모수 nnpp 인 이항 분포의 확률 질량 함수는 다음과 같다.
f(x)={nCxpxqnx,x=0,1,2,,n,q=1p0,otherwisef(x)={nCxpxqnx,x=0,1,2,,n,q=1p0,otherwise

 

이항 분포(B(n,p)B(n,p))의 그래프

  • 이항 분포 B(n,p)B(n,p) 의 그래프는 다음과 같다.
nn 에 따른 이항 분포의 그래프 pp 에 따른 이항 분포의 그래프
  • pp 가 일정하고 nn 이 커지면 이항 분포종 모양의 좌우 대칭형에 가까워진다.
  • p<0.5p<0.5 이면 이항 분포왼쪽으로 치우치고, 오른쪽으로 긴 꼬리 모양을 가지는 양의 비대칭인 분포를 이룬다.
  • p>0.5p>0.5 이면 이항 분포오른쪽으로 치우치고 왼쪽으로 긴 꼬리 모양을 가지는 음의 비대칭인 분포를 이룬다.
  • p=0.5p=0.5 이면 nn 에 관계 없이 μ=n2μ=n2 을 중심으로 좌우 대칭이다.
    • 이 경우를 대칭 이항 분포(Symmetric Binomial Distribution)라 한다.

 

이항 분포에 따르는 확률 변수 XX 의 평균과 분산

  • 매회 성공률이 pp베르누이 시행nn 번 독립적으로 반복하여 ii 번째 시행에서 성공이면 Xi=1Xi=1 실패이면 Xi=0Xi=0 이라 하자.
  • 그러면 E(Xi)=p,Var(Xi)=p(1p),i=1,2,,nE(Xi)=p,Var(Xi)=p(1p),i=1,2,,n 이다.
  • 이 때, 각 확률 변수 XiXi 가 취하는 값은 0과 1뿐이므로 X=X1+X2++XnX=X1+X2++Xn 이 취할 수 있는 값은 0,1,2,,n0,1,2,,n 이다.
  • 그리고 확률 변수 XXnn 번 독립적으로 반복 시행한 베르누이 시행에서 성공한 횟수를 나타낸다.
  • XX 는 모수 nnpp이항 분포확률 변수독립베르누이 확률 변수들의 합과 같다.
  • 따라서 이항 분포에 따르는 확률 변수 XX평균분산은 다음과 같다.
μ=E(X1+X2++Xn)=E(X1)+E(X2)++E(Xn)=p+p++p=npμ=E(X1+X2++Xn)=E(X1)+E(X2)++E(Xn)=p+p++p=np
σ2=Var(X1+X2++Xn)=Var(X1)+Var(X2)++Var(Xn)=p(1p)+p(1p)++p(1p)=np(1p)σ2=Var(X1+X2++Xn)=Var(X1)+Var(X2)++Var(Xn)=p(1p)+p(1p)++p(1p)=np(1p)
  • 즉, XB(n,p)평균 분산은 각각 다음과 같다.
① 평균 : μ=np
② 분산 : σ2=npq,q=1p

 

예제 : 4지선다형으로 주어진 5문제에서 임의로 답을 선택할 때, 정답을 선택한 문제 수를 확률 변수 X 라 한다. 이 때, X 의 확률 질량 함수 f(x)X 의 평균과 분산을 구하라.
해설 보기

각 문제당 정답을 선택할 확률은 0.25이고, 정답을 선택하는 것은 독립 시행이므로 확률 변수 X 는 모수 n=5,p=0.25 인 이항 분포를 따른다.

따라서 X 의 확률 질량 함수는 다음과 같다.

 

f(x)={5Cx(0.25)x(0.75)5x,x=0,1,2,3,4,50,otherwise

 

그리고 X평균분산은 각각 μ=5×0.25=1.25,σ2=5×0.25×0.75=0.9375 이다.

 

이항 분포와 확률

  • 특히 모수 n=1p이항 분포는 모수 p베르누이 분포와 일치한다.
  • 그리고 XB(n,p) 일 때, a=0,1,,n 에 대해 다음과 같이 확률을 계산할 수 있다.
P(X=a)=P(Xa)P(Xa1)
P(a<Xb)=P(Xb)P(Xa)
P(X>a)=1P(Xa)

 

예제 : 4지선다형으로 주어진 5문제에서 임의로 답을 선택할 때, 정답을 선택한 문제 수를 확률 변수 X 라 한다. 이 때, 다음 확률을 구하라. (단, 소숫점 이하 다섯째 자리에서 반올림한다.)

(a) P(X1)

(b) P(X=2)

(c) P(X<3)

(d) P(X>3)

해설 보기

x=0,1,,5 에 대해 f(x)=5Cx(0.25)x(0.75)5x 이므로 구하고자 하는 확률은 다음과 같다.

 

(a)

P(X1)=f(0)+f(1)=5C0(0.75)5+5C1(0.25)1(0.75)40.2373+0.3955=0.6328

 

(b)

P(X=2)=f(2)=5C2(0.25)2(0.75)30.2367

 

(c)

P(X<3)=P(X2)=f(0)+f(1)+f(2)0.8965

 

(d)

P(X>3)=P(X4)=f(4)+f(5)=5C4(0.25)4(0.75)1+5C5(0.25)5(0.75)00.0146+0.001=0.0156

 

이항 분포의 확률 계산 (이항 누적 확률표 이용)

  • 이항 분포에 대한 확률이항 누적 확률표(Cumulative Binomial Distribution Table)를 이용하여 쉽게 구할 수 있다.
  • 예를 들어, XB(8,0.45) 일 때 P(X4)이항 누적 확률표를 이용하여 다음과 같이 구한다.
① 좌측 열에서 n 이 8인 부분을 선정한다.
② 상단에서 p 가 0.45인 열을 선택한다.
③ 좌측열에서 x 가 4인 행을 선택한다.
x 가 4인 행과 p 가 0.5인 열이 만나는 위치의 수 0.7396을 선택한다.
P(X4)=0.7396 이다.

이항 누적 확률표

 

이항 누적 확률표(Cumulative Binomial Distribution Table)

Cumulative Binomial Distribution Table.pdf
0.08MB

 

이항 분포의 합성

  • XY독립이고, XB(m,p),YB(n,p) 라 하면, X+YB(m+n,p) 가 성립한다.
  • 일반적으로 독립이항 분포를 따르는 확률 변수 XiB(ni,p),i=1,2,,k 에 대해 다음이 성립한다.
XB(n,p),,X=ki=1Xi,n=ki=1ni

 

예제 : 이항 분포를 따르는 독립인 두 확률 변수 XB(3,0.25)YB(5,0.25) 에 대해 이항 누적 확률표를 이용하여 다음 확률을 구하라.

(a) P(X+Y4)

(b) P(X+Y=4)

(c) P(X+Y4)

해설 보기

XB(3,0.25)YB(5,0.25) 이고, XY 가 독립이므로 X+YB(8,0.25) 이다. 

따라서 이항 누적 확률표로부터 다음을 얻는다.

 

(a)

P(X+Y4)=0.9727

 

(b)

P(X+Y=4)=P(X+Y4)P(X+Y3)=0.97270.8862=0.0865

 

(c)

P(X+Y4)=1P(X+Y3)=10.8862=0.1138

728x90
728x90

이산 확률 분포베르누이 분포(Bernoulli Distribution)이항 분포(Binomial Distribution)매회 성공률이 p 인 베르누이 시행을 n 번 독립적으로 반복하여 성공한 횟수에 대한 확률이항 분포(B(n,p))의 그래프이항 분포에 따르는 확률 변수 X 의 평균과 분산이항 분포와 확률이항 분포의 확률 계산 (이항 누적 확률표 이용)이항 분포의 합성