728x90
728x90

모비율의 추정

모비율의 신뢰 구간

  • 표본의 크기 n 이 충분히 크다면, 모집단의 모비율 p 에 대한 점 추정량은 표본 비율 p^=Xn 이고, p^ 는 다음과 같은 정규 분포에 근사한다. (관련 내용 바로가기)
p^N(p,pqn)    또는    Z=p^ppqnN(0,1)    (단,    q=1p)
  • 그러므로 다음을 얻는다.
P(|Z|zα2)1αP(|p^ppqn|zα2)=P(|p^p|zα2pqn)1αP(p^zα2pqnpp^+zα2pqn)1α
  • 따라서 모비율 p 에 대한 100(1α) % 신뢰 구간은 다음과 같다.
p^zα2pqnpp^+zα2pqn
  • 한편, 모비율 p 는 알려지지 않은 수치이므로 신뢰 구간의   값을 계산할 수 없다.
  • 그러나 표본의 크기 n 이 충분히 크다면 p^p 가 알려져 있으며,   안의 pq 를 각각 p^q^=1p^ 로 대치할 수 있다.
  • 그러면 모비율 p 에 대한 90%, 95%, 99% 신뢰 구간은 다음과 같다.
- 90% 신뢰 구간 :    p^1.645p^q^npp^+1.645p^q^n

- 95% 신뢰 구간 :    p^1.96p^q^npp^+1.96p^q^n

- 99% 신뢰 구간 :    p^2.58p^q^npp^+2.58p^q^n

 

예제 : 정부에서 실시하고자 하는 특정한 정책에 대해 찬성률을 알고자 한다. 이를 위해 국민 1,200명을 임의로 선정하여 조사한 결과 560명이 찬성하였다. 이 정책에 대한 국민의 몇 %가 찬성하는지 신뢰도 95%의 신뢰 구간을 구하라. 단, 소수점 이하 셋째 자리에서 반올림한다.
해설 보기

n=1200,p^=58012000.48,q^0.52 이므로 95% 신뢰 구간을 구하면 다음과 같다.

0.481.960.48×0.521200p0.48+1.960.48×0.5212000.480.0283p0.48+0.02830.45p0.51

 

두 모비율 차의 신뢰 구간

  • 독립인 두 모집단에 대해 모비율이 각각 p1p2 라고 하자.
  • 이 때 두 모비율의 차 p1p2 에 대한 신뢰 구간을 구하는 방법을 살펴보자.
  • 두 모집단에서 각각 크기 nm 인 표본을 선정하여 표본 비율을 각각 p1^.p2^ 라 하자.
  • 이 때 표본의 크기 nm 이 충분히 크면, p1^p1,p2^p2 이고 두 표본 비율은 독립이다.
  • 표본 비율 정규 분포에 근사하므로 다음이 성립한다. (관련 내용 바로가기)
p1^N(p1,p1^q1^n),p2^N(p2,p2^q2^m)
  • 따라서 두 표본 비율의 차 p1^p2^ 의 표준화 확률 변수 Z 는 다음 정규 분포에 근사한다.
p1^p2^N(p1p2,p1^q1^n+p2^q2^m)Z=(p1^p2^)(p1p2)p1^q1^n+p2^q2^mN(0,1)
  • 그러므로 양쪽 꼬리 확률이 각각 α2 인 임계점 zα2zα2 에 대해 다음이 성립한다.
P(|Z|zα2)=1αP(zα2(p1^p2^)(p1p2)p1^q1^n+p2^q2^mzα2)=1αP((p1^p2^)zα2p1^q1^n+p2^q2^mp1p2(p1^p2^)+zα2p1^q1^n+p2^q2^m)=1α
  • 따라서 두 모비율의 차 p1p2 에 대한 90%, 95%, 99% 신뢰 구간은 다음과 같다.
- 90% 신뢰 구간 :    (p1^p2^)1.645p1^q1^n+p2^q2^mp1p2(p1^p2^)+1.645p1^q1^n+p2^q2^m

- 95% 신뢰 구간 :    (p1^p2^)1.96p1^q1^n+p2^q2^mp1p2(p1^p2^)+1.96p1^q1^n+p2^q2^m

- 99% 신뢰 구간 :    (p1^p2^)2.58p1^q1^n+p2^q2^mp1p2(p1^p2^)+2.58p1^q1^n+p2^q2^m

 

예제 : 어떤 제품을 생산하는 생산 라인 A와 B의 불량률의 차이를 알아보고자 한다. 생산 라인 A에서 생산한 제품 450개 중에서 18개가 불량품이었고, 생산 라인 B에서 생산한 제품 400개 중에서 14개가 불량품이었다. 두 생산 라인의 불량률의 차에 대한 95% 신뢰 구간을 구하라.
해설 보기

생산 라인 A와 B에 대한 표본 조사 결과는 다음과 같다.

생산 라인 A n=450,p1^=18450=0.04,q1^=0.96
생산 라인 B m=400,p2^=14400=0.035,q2^=0.965

따라서 p1^p2^=0.005 이고 다음을 얻는다.

1.960.04×0.96450+0.035×0.965400=0.0255

두 생산 라인에 대한 불량률의 차에 대한 95% 신뢰 구간을 구하면 다음과 같다.

0.0050.0255p1p20.005+0.02250.0205p1p20.0275

 

728x90
728x90

모비율의 추정모비율의 신뢰 구간두 모비율 차의 신뢰 구간