모비율의 검정
- 이 페이지에서는 정당의 지지율, TV 프로그램의 시청률 또는 생산 제품의 불량률 등과 같은 모집단의 비율에 대한 주장을 검정하는 방법을 살펴본다.
단일 모비율에 대한 검정
- 모비율 pp 에 대한 추정을 위해 표본 비율 ˆp^p 를 사용한 것과 동일하게, 모비율 pp 에 대한 가설을 검정하기 위해 표본 비율 ˆp^p 를 사용한다.
- 그러면 모비율 pp 에 대해 다음과 같은 3가지 유형의 귀무 가설을 생각할 수 있다.
H0:p=p0,H0:p≤p0,H0:p≥p0H0:p=p0,H0:p≤p0,H0:p≥p0 |
- 그리고 이에 대한 대립 가설은 각각 다음과 같다.
H0:p≠p0,H0:p>p0,H0:p<p0H0:p≠p0,H0:p>p0,H0:p<p0 |
- 특히 모비율 pp 에 대한 귀무 가설의 참 또는 거짓이 밝혀지기 전까지 모비율은 p=p0p=p0 로 생각한다.
- 따라서 표본의 크기 nn 이 충분히 크면 표본 비율 ˆp^p 는 점근적으로 정규 분포 N(p0,p0q0n)N(p0,p0q0n) 를 따르므로 모비율 pp 의 주장에 대한 검정 통계량과 확률 분포는 다음과 같다.
Z=ˆp−p0√p0q0n≈N(0,1)Z=^p−p0√p0q0n≈N(0,1)
양측 검정
- 두 가설 H0:p=p0,H1:p≠p0H0:p=p0,H1:p≠p0 에 대해 유의 수준을 αα 라 하자.
- 그러면 양쪽 꼬리 확률이 각각 α2α2 가 되는 두 임계값이 ±zα2±zα2 이므로 귀무 가설의 기각역은 다음과 같다.
Z≤−zα2,Z≥zα2Z≤−zα2,Z≥zα2
- 그러면 표본 비율의 관찰값 ˆp^p 에 대해 검정 통계량의 관찰값 z0z0 는 다음과 같다.
z0=ˆp−p0√p0q0nz0=^p−p0√p0q0n
- 이 때, 검정 통계량의 관찰값 z0z0 에 대해 z0≤−zα2z0≤−zα2 또는 z0≥zα2z0≥zα2 이면 H0H0 를 기각하고, −zα2<z0<zα2−zα2<z0<zα2 이면 H0H0 를 기각하지 못한다.
- 그리고 pp-값은 모평균에 대한 검정과 동일하게 정의된다.
- 이 때, p−값>αp−값>α 이면 H0H0 를 채택하고, p−값≤αp−값≤α 이면 H0H0 를 기각한다.
상단측 검정
- 두 가설 H0:p≤p0,H1:p>p0H0:p≤p0,H1:p>p0 에 대해 유의 수준을 αα 라 하면 기각역은 다음과 같다.
Z≥zαZ≥zα
- 이 때, 검정 통계량의 관찰값 z0z0 에 대해 z0≥zαz0≥zα 이면 H0H0 를 기각하고, z0<zαz0<zα 이면 H0H0 를 기각하지 못한다.
- 또한 p−값>αp−값>α 이면 H0H0 를 채택하고, p−값≤αp−값≤α 이면 H0H0 를 기각한다.
하단측 검정
- 두 가설 H0:p≥p0,H1:p<p0H0:p≥p0,H1:p<p0 에 대해 유의 수준을 αα 라 하면 기각역은 다음과 같다.
Z≤−zαZ≤−zα
- 이 때, 검정 통계량의 관찰값 z0z0 에 대해 z0≤−zαz0≤−zα 이면 H0H0 를 기각하고, z0>zαz0>zα 이면 H0H0 를 기각하지 못한다.
- 또한 p−값>αp−값>α 이면 H0H0 를 채택하고, p−값≤αp−값≤α 이면 H0H0 를 기각한다.
모비율에 대한 검정 유형과 기각역 그리고 pp-값
검정 방법 \ 가설과 기각역 | 귀무 가설 H0H0 | 대립 가설 H1H1 | H0H0 의 기각역 | pp-값 |
하단측 검정 | p≥p0p≥p0 | p<p0p<p0 | Z≤−zαZ≤−zα | P(Z<z0)P(Z<z0) |
상단측 검정 | p≤p0p≤p0 | p>p0p>p0 | Z≥zαZ≥zα | P(Z>z0)P(Z>z0) |
양측 검정 | p=p0p=p0 | p≠p0p≠p0 | |Z|≥zα2|Z|≥zα2 | 2[1−P(Z<z0)]2[1−P(Z<z0)] |
예제 : 한 포털 사이트에서 인터넷 신문을 이용하는 사람의 비율이 54.5%를 초과한다고 주장하고 있다. 이를 검정하기 위해 427명을 임의로 선정한 결과, 256명이 인터넷 신문을 이용하는 것으로 조사되었다. pp-값을 구하여 유의 수준 5%에서 조사하라.
(1)
검정하고자 하는 주장은 p>0.545p>0.545 이므로 등호를 포함하지 않는다.
따라서 이 주장을 대립 가설로 설정한다.
즉, 귀무 가설 H0:p≤0.545H0:p≤0.545 와 대립 가설 H1:p>0.545H1:p>0.545 (주장)를 설정한다.
(2)
n=427,p0=0.545,q0=0.455n=427,p0=0.545,q0=0.455 이므로 검정 통계량은 다음과 같다.
Z=ˆp−0.545√0.545×0.455427=ˆp−0.5450.024Z=^p−0.545√0.545×0.455427=^p−0.5450.024 |
(3)
ˆp=256427=0.5995^p=256427=0.5995 이므로 검정 통계량의 관찰값은 z0=0.5995−05450.024=2.27z0=0.5995−05450.024=2.27 이다.
(4)
p−값=P(Z>2.27)=0.0116p−값=P(Z>2.27)=0.0116
(5)
pp-값이 유의 수준 α=0.05α=0.05 보다 작으므로 귀무 가설을 기각한다.
즉, 포털 사이트의 주장은 설득력이 없다.
두 모비율의 차에 대한 검정
- 모비율이 p1p1 과 p2p2 이고 독립인 두 모집단의 모비율 차 p1−p2p1−p2 에 대해 다음과 같은 귀무 가설을 생각할 수 있다.
H0:p1−p2=p0,H0:p1−p2≤p0,H0:p1−p2≥p0H0:p1−p2=p0,H0:p1−p2≤p0,H0:p1−p2≥p0 |
- 그리고 이에 대한 대립 가설은 각각 다음과 같다.
H1:p1−p2≠p0,H1:p1−p2>p0,H1:p1−p2<p0H1:p1−p2≠p0,H1:p1−p2>p0,H1:p1−p2<p0 |
- 이 때, 두 모집단에서 각각 크기가 nn 과 mm 인 두 표본의 표본 비율을 각각 ^p1^p1 과 ^p2^p2 라 하면, 다음 정규 분포를 따른다.
^p1∼N(p1,p1q1n),^p2∼N(p2,p2q2m)^p1∼N(p1,p1q1n),^p2∼N(p2,p2q2m) |
- 따라서 두 표본 비율의 차 ^p1−^p2^p1−^p2 는 다음 정규 분포를 따른다.
^p1−^p2∼N(p1−p2,p1q1n+p2q2m)^p1−^p2∼N(p1−p2,p1q1n+p2q2m) |
- 그러므로 ^p1−^p2^p1−^p2 의 표준화 확률 변수는 다음과 같다.
Z=(^p1−^p2)−(p1−p2)√p1q1n+p2q2m≈N(0,1)Z=(^p1−^p2)−(p1−p2)√p1q1n+p2q2m≈N(0,1) |
- 한편, 크기 nn 과 mm 이 클수록 ^p1≈p1,^p2≈p2^p1≈p1,^p2≈p2 이므로 두 모비율의 차에 대한 주장 p1−p2=p0p1−p2=p0 인 귀무 가설을 검정하기 위한 검정 통계량 ZZ 와 그에 대한 확률 분포는 다음과 같다.
Z=(^p1−^p2)−p0√p1q1n+p2q2m≈N(0,1)Z=(^p1−^p2)−p0√p1q1n+p2q2m≈N(0,1)
- 특히, p0=0p0=0 이면 두 모비율이 동일하다는 가설이므로 공동의 모비율 p1=p2=pp1=p2=p 에 대한 추론이고, 이 때 p 에 대한 검정을 위해 합동 표본 비율을 사용한다.
합동 표본 비율(Pooled Sample Proportion)
크기가 n 과 m 인 두 표본에 대한 성공의 횟수 x 와 y 에 대해 비율 ˆp=x+yn+m 를 합동 표본 비율(Pooled Sample Proportion)이라 한다.
- 따라서 모비율 p1=p2=p 에 대한 가설을 검정하기 위한 검정 통계량과 확률 분포는 다음과 같다.
Z=^p1−^p2√ˆpˆq(1n+1m)≈N(0,1)
- 그러면 유의 수준이 α 에 대한 가설 검정의 기각역과 p-값을 정리하면 다음과 같다.
검정 방법 \ 가설과 기각역 | 귀무 가설 H0 | 대립 가설 H1 | H0 의 기각역 | p-값 |
하단측 검정 | p1≥p2 | p1<p2 | Z≤−zα | P(Z<z0) |
상단측 검정 | p1≤p2 | p1>p2 | Z≥zα | P(Z>z0) |
양측 검정 | p1=p2 | p1≠p2 | |Z|≥zα2 | 2[1−P(Z<z0)] |
예제 : A와 B 두 도시에서 각각 450명, 490명을 임의로 선정하여 특정 정당의 지지도를 조사했다. 조사 결과 A와 B 도시의 지지자는 각각 245명, 239명이었다. 이 자료를 근거로 두 도시의 지지도에 차이가 있는지 유의 수준 5%에서 조사하라.
(1)
A와 B 도시의 정당 지지율을 각각 p1,p2 라고 하고, 귀무 가설 H0:p1=p2 와 대립 가설 H1:p1≠p2 를 설정한다.
즉 귀무 가설은 H0:p1−p2=0, 대립 가설은 H1:p1−p2≠0 이다.
(2)
유의 수준이 α=0.05 이므로 z0.025=1.96 이고, 기각역은 Z≤−1.96,Z≥1.96 이다.
(3)
n=450,m=490 이므로 합동 표본 비율은 ˆp=245+239450+490=0.5149,ˆq=0.4851 이다.
따라서 검정 통계량은 다음과 같다.
Z=^p1−^p2√0.5149×0.4851×(1450+1490)=^p1−^p20.0326 |
(4)
^p1=245450=0.5444,^p2=239490=0.4878,^p1−^p2=0.0566 이므로 검정 통계량의 관찰값은 z0=0.05660.0326=1.736 이다.
(5)
관찰값 z0=1.736 은 기각역 안에 놓이지 않으므로 귀무 가설을 기각할 수 없다.
즉, A와 B 두 도시간의 어떤 정당 지지율에 차이가 없다고 할 수 있다.
'Mathematics > 확률과 통계' 카테고리의 다른 글
[확률과 통계] 모평균의 검정 (σ² : 미지) (0) | 2022.12.01 |
---|---|
[확률과 통계] 모평균의 검정(σ² : 기지) (0) | 2022.11.30 |
[확률과 통계] 통계적 가설 검정 (0) | 2022.11.28 |
[확률과 통계] 모비율의 추정 (0) | 2022.11.28 |
[확률과 통계] 모평균의 추정 (0) | 2022.11.27 |
[확률과 통계] 모집단과 표본 (0) | 2022.11.21 |
[확률과 통계] 연속 확률 분포 (0) | 2022.11.21 |
[확률과 통계] 이산 확률 분포 (0) | 2022.11.14 |