728x90
728x90

모비율의 검정

  • 이 페이지에서는 정당의 지지율, TV 프로그램의 시청률 또는 생산 제품의 불량률 등과 같은 모집단의 비율에 대한 주장을 검정하는 방법을 살펴본다.

 

단일 모비율에 대한 검정

  • 모비율 pp 에 대한 추정을 위해 표본 비율 ˆp^p 를 사용한 것과 동일하게, 모비율 pp 에 대한 가설을 검정하기 위해 표본 비율 ˆp^p 를 사용한다.
  • 그러면 모비율 pp 에 대해 다음과 같은 3가지 유형의 귀무 가설을 생각할 수 있다.
H0:p=p0,H0:pp0,H0:pp0H0:p=p0,H0:pp0,H0:pp0
  • 그리고 이에 대한 대립 가설은 각각 다음과 같다.
H0:pp0,H0:p>p0,H0:p<p0H0:pp0,H0:p>p0,H0:p<p0
  • 특히 모비율 pp 에 대한 귀무 가설의 참 또는 거짓이 밝혀지기 전까지 모비율은 p=p0p=p0 로 생각한다.
  • 따라서 표본의 크기 nn 이 충분히 크면 표본 비율 ˆp^p 는 점근적으로 정규 분포 N(p0,p0q0n)N(p0,p0q0n) 를 따르므로 모비율 pp 의 주장에 대한 검정 통계량과 확률 분포는 다음과 같다.
Z=ˆpp0p0q0nN(0,1)Z=^pp0p0q0nN(0,1)

 

양측 검정

  • 두 가설 H0:p=p0,H1:pp0H0:p=p0,H1:pp0 에 대해 유의 수준을 αα 라 하자.
  • 그러면 양쪽 꼬리 확률이 각각 α2α2 가 되는 두 임계값이 ±zα2±zα2 이므로 귀무 가설의 기각역은 다음과 같다.
Zzα2,Zzα2Zzα2,Zzα2
  • 그러면 표본 비율의 관찰값 ˆp^p 에 대해 검정 통계량의 관찰값 z0z0 는 다음과 같다.
z0=ˆpp0p0q0nz0=^pp0p0q0n
  • 이 때, 검정 통계량의 관찰값 z0z0 에 대해 z0zα2z0zα2 또는 z0zα2z0zα2 이면 H0H0 를 기각하고, zα2<z0<zα2zα2<z0<zα2 이면 H0H0 를 기각하지 못한다.
  • 그리고 pp-값은 모평균에 대한 검정과 동일하게 정의된다.
  • 이 때, p>αp>α 이면 H0H0채택하고, pαpα 이면 H0H0기각한다.

 

상단측 검정

  • 두 가설 H0:pp0,H1:p>p0H0:pp0,H1:p>p0 에 대해 유의 수준을 αα 라 하면 기각역은 다음과 같다.
ZzαZzα
  • 이 때, 검정 통계량의 관찰값 z0z0 에 대해 z0zαz0zα 이면 H0H0 를 기각하고, z0<zαz0<zα 이면 H0H0 를 기각하지 못한다.
  • 또한 p>αp>α 이면 H0H0채택하고, pαpα 이면 H0H0기각한다.

 

하단측 검정

  • 두 가설 H0:pp0,H1:p<p0H0:pp0,H1:p<p0 에 대해 유의 수준을 αα 라 하면 기각역은 다음과 같다.
ZzαZzα
  • 이 때, 검정 통계량의 관찰값 z0z0 에 대해 z0zαz0zα 이면 H0H0 를 기각하고, z0>zαz0>zα 이면 H0H0 를 기각하지 못한다.
  • 또한 p>αp>α 이면 H0H0 채택하고, pαpα 이면 H0H0 기각한다.

 

모비율에 대한 검정 유형과 기각역 그리고 pp-값

검정 방법 \ 가설과 기각역 귀무 가설 H0H0 대립 가설 H1H1 H0H0 의 기각역 pp-값
하단측 검정 pp0pp0 p<p0p<p0 ZzαZzα P(Z<z0)P(Z<z0)
상단측 검정 pp0pp0 p>p0p>p0 ZzαZzα P(Z>z0)P(Z>z0)
양측 검정 p=p0p=p0 pp0pp0 |Z|zα2|Z|zα2 2[1P(Z<z0)]2[1P(Z<z0)]

 

예제 : 한 포털 사이트에서 인터넷 신문을 이용하는 사람의 비율이 54.5%를 초과한다고 주장하고 있다. 이를 검정하기 위해 427명을 임의로 선정한 결과, 256명이 인터넷 신문을 이용하는 것으로 조사되었다. pp-값을 구하여 유의 수준 5%에서 조사하라.
해설 보기

(1)

검정하고자 하는 주장은 p>0.545p>0.545 이므로 등호를 포함하지 않는다. 

따라서 이 주장을 대립 가설로 설정한다.

즉, 귀무 가설 H0:p0.545H0:p0.545 와 대립 가설 H1:p>0.545H1:p>0.545 (주장)를 설정한다.

 

(2)

n=427,p0=0.545,q0=0.455n=427,p0=0.545,q0=0.455 이므로 검정 통계량은 다음과 같다.

Z=ˆp0.5450.545×0.455427=ˆp0.5450.024Z=^p0.5450.545×0.455427=^p0.5450.024

 

(3)

ˆp=256427=0.5995^p=256427=0.5995 이므로 검정 통계량의 관찰값은 z0=0.599505450.024=2.27z0=0.599505450.024=2.27 이다.

 

(4)

p=P(Z>2.27)=0.0116p=P(Z>2.27)=0.0116

 

(5)

pp-값이 유의 수준 α=0.05α=0.05 보다 작으므로 귀무 가설을 기각한다. 

즉, 포털 사이트의 주장은 설득력이 없다.

 

두 모비율의 차에 대한 검정

  • 모비율이 p1p1p2p2 이고 독립인 두 모집단의 모비율 차 p1p2p1p2 에 대해 다음과 같은 귀무 가설을 생각할 수 있다.
H0:p1p2=p0,H0:p1p2p0,H0:p1p2p0H0:p1p2=p0,H0:p1p2p0,H0:p1p2p0
  • 그리고 이에 대한 대립 가설은 각각 다음과 같다.
H1:p1p2p0,H1:p1p2>p0,H1:p1p2<p0H1:p1p2p0,H1:p1p2>p0,H1:p1p2<p0
  • 이 때, 두 모집단에서 각각 크기가 nnmm 인 두 표본의 표본 비율을 각각 ^p1^p1^p2^p2 라 하면, 다음 정규 분포를 따른다.
^p1N(p1,p1q1n),^p2N(p2,p2q2m)^p1N(p1,p1q1n),^p2N(p2,p2q2m)
  • 따라서 두 표본 비율의 차 ^p1^p2^p1^p2 는 다음 정규 분포를 따른다.
^p1^p2N(p1p2,p1q1n+p2q2m)^p1^p2N(p1p2,p1q1n+p2q2m)
  • 그러므로 ^p1^p2^p1^p2 표준화 확률 변수는 다음과 같다.
Z=(^p1^p2)(p1p2)p1q1n+p2q2mN(0,1)Z=(^p1^p2)(p1p2)p1q1n+p2q2mN(0,1)
  • 한편, 크기 nnmm 이 클수록 ^p1p1,^p2p2^p1p1,^p2p2 이므로 두 모비율의 차에 대한 주장 p1p2=p0p1p2=p0 인 귀무 가설을 검정하기 위한 검정 통계량 ZZ 와 그에 대한 확률 분포는 다음과 같다.
Z=(^p1^p2)p0p1q1n+p2q2mN(0,1)Z=(^p1^p2)p0p1q1n+p2q2mN(0,1)
  • 특히, p0=0p0=0 이면 두 모비율이 동일하다는 가설이므로 공동의 모비율 p1=p2=pp1=p2=p 에 대한 추론이고, 이 때 p 에 대한 검정을 위해 합동 표본 비율을 사용한다.

 

합동 표본 비율(Pooled Sample Proportion) 
크기가 nm 인 두 표본에 대한 성공의 횟수 xy 에 대해 비율 ˆp=x+yn+m합동 표본 비율(Pooled Sample Proportion)이라 한다.

 

  • 따라서 모비율 p1=p2=p 에 대한 가설을 검정하기 위한 검정 통계량확률 분포는 다음과 같다.
Z=^p1^p2ˆpˆq(1n+1m)N(0,1)
  • 그러면 유의 수준이 α 에 대한 가설 검정의 기각역 p-값을 정리하면 다음과 같다.
검정 방법 \ 가설과 기각역 귀무 가설 H0 대립 가설 H1 H0 의 기각역 p-값
하단측 검정 p1p2 p1<p2 Zzα P(Z<z0)
상단측 검정 p1p2 p1>p2 Zzα P(Z>z0)
양측 검정 p1=p2 p1p2 |Z|zα2 2[1P(Z<z0)]

 

예제 : A와 B 두 도시에서 각각 450명, 490명을 임의로 선정하여 특정 정당의 지지도를 조사했다. 조사 결과 A와 B 도시의 지지자는 각각 245명, 239명이었다. 이 자료를 근거로 두 도시의 지지도에 차이가 있는지 유의 수준 5%에서 조사하라.
해설 보기

(1)

A와 B 도시의 정당 지지율을 각각 p1,p2 라고 하고, 귀무 가설 H0:p1=p2 와 대립 가설 H1:p1p2 를 설정한다.

즉 귀무 가설은 H0:p1p2=0, 대립 가설은 H1:p1p20 이다.

 

(2)

유의 수준이 α=0.05 이므로 z0.025=1.96 이고, 기각역은 Z1.96,Z1.96 이다.

 

(3)

n=450,m=490 이므로 합동 표본 비율은 ˆp=245+239450+490=0.5149,ˆq=0.4851 이다. 

따라서 검정 통계량은 다음과 같다.

Z=^p1^p20.5149×0.4851×(1450+1490)=^p1^p20.0326

 

(4)

^p1=245450=0.5444,^p2=239490=0.4878,^p1^p2=0.0566 이므로 검정 통계량의 관찰값은 z0=0.05660.0326=1.736 이다.

 

(5)

관찰값 z0=1.736 은 기각역 안에 놓이지 않으므로 귀무 가설을 기각할 수 없다.

즉, A와 B 두 도시간의 어떤 정당 지지율에 차이가 없다고 할 수 있다.

728x90
728x90

모비율의 검정단일 모비율에 대한 검정양측 검정상단측 검정하단측 검정모비율에 대한 검정 유형과 기각역 그리고 p-값두 모비율의 차에 대한 검정