728x90
728x90

모평균의 검정 (σ² : 미지)

  • 이전 글에서는 모집단의 분산을 알고 있는 경우에 모평균과 두 모평균 차에 대한 주장을 검정하는 방법을 살펴보았다.
  • 그러나 대부분의 모집단은 모분산이 알려져 있지 않다. 
  • 따라서 모분산을 모르는 경우에 모평균에 대한 주장을 검정하는 방법을 살펴볼 필요가 있다.
  • 모분산이 알려져 있지 않은 경우에는 정규 분포와 매우 흡사 tt-분포를 사용한다.
  • 이 페이지에서는 tt-분포를 이용하여 모분산이 알려져 있지 않은 정규 모집단의 모평균과 두 모평균의 차에 대한 주장을 검정하는 방법을 살펴본다.

 

tt-검정(tt-Test)

William Sealey Gosset (1876-1937)

  • 근대 통계학의 기초가 되는 소표본론에서 많은 업적을 남긴 영국의 통계학자인 윌리엄 고셋(William Sealey Gosset, 1876-1937)이 소표본을 분석하기 위해 고안한 검정 방법이다.
  • 이 분포는 1908년에 Student's t-분포라는 필명으로 발표한 논문에서 처음으로 사용하면서 알려졌으며, 이러한 이유로 tt-분포Student's tt-분포라고도 한다.
  • 이 분포는 표준 정규 분포와 매우 흡사하며, 모분산이 알려지지 않은 정규 모집단에서 소표본을 추출하여 모평균을 추론할 때 주로 사용한다.

 

tt- 분포(tt-Distribution)

  • 표본의 크기가 작은 경우, 즉 n<30n<30 인 경우에 모평균 또는 모평균 차의 추론에 사용하며, 다음과 같이 정의한다.
연속 확률 변수 XX 의 확률 밀도 함수 f(x)f(x) 가 다음과 같을 때, 확률 변수 XX 는 자유도 nn tt-분포(T-Distribution)을 따른다고 하고, Xt(n)Xt(n) 으로 나타낸다.
f(x)=Γ(n+12)nπΓ(n2)(1+x2n)n+12,<x<f(x)=Γ(n+12)nπΓ(n2)(1+x2n)n+12,<x<

 

특성

  • t-분포는 표준 정규 분포와 비교하여 다음과 같은 특성을 갖는다.
① 분포 곡선은 x=0 에서 최댓값을 갖고, 좌우 대칭이다.
② 분포 곡선은 표준 정규 분포와 같이 종 모양이다.
t-분포의 꼬리 부분이 표준 정규 분포보다 약간 두텁다. (a)
자유도 n 이 증가하면 t-분포는 표준 정규 분포근접하게 된다. (b)

t-분포의 그래프

  • 일반적으로 자유도 nt-분포에서 100(1α)% 백분위수 t=tα(n) 으로 나타낸다.
  • 즉, 오른쪽 꼬리 확률 α 에 대해 P[T>tα(n)]=α 이다.
  • 그러면 t-분포는 x=0 에 대해 대칭이므로 다음이 성립한다.
P[Ttα(n)]=P[Ttα(n)]=α
P[|T|tα2(n)]=1α
  • 아래 그림은 이와 같은 성질을 보여준다.

t-분포의 100(1-&alpha;)% 백분위수 t_&alpha;(n)

 

t-분포표를 이용하여 백분위수 계산

  • 자유도 nt-분포에서 오른쪽 꼬리 확률이 α100(1α)% 백분위수 tα(n) 을 구하기 위해서는 t-분포표(t-Distribution Table)를 이용한다.
  • 예를 들어, 자유도가 5인 t-분포에서 97.5% 백분위수 t0.025(5) 를 다음과 같이 t-분포표를 이용하여 구할 수 있다.
① 자유도를 나타내는 d.f 열에서 5를 선택한다.
② 오른쪽 꼬리 확률을 나타내는 α 행에서 0.025를 선택한다.
③ d.f가 5인 행과 α 가 0.025인 열이 만나는 수 2.571을 선택한다.
t0.025(5)=2.571 이다. 즉, P(X2.571)=0.975 또는 P(X2.571)=0.025

t-분포표

 

t-분포표(t-Distribution Table)

t-Distribution Table.pdf
0.22MB

 

t-검정(t-Test)

  • 모분산 σ2 을 모르는 정규 모집단의 모평균 μ 에 대한 주장을 검정하는 방법을 살펴보자.
  • 만약 모분산 σ2 을 알고 있다면, 크기 n표본 평균표준화 화률 변수 Z 는 다음과 같다.
Z=¯Xμσnt(n1)
  • 그러나 모분산 σ2 을 모르기 때문에 검정 통계량 Z 와 표준 정규 분포를 사용할 수 없다. 한편, 크기 n 인 표본의 표본 분산 s2 또는 표본 표준 편차 s 를 구할 수 있다.
  • 이 때, 검정 통계량 Z 에서 알려지지 않은 모표준 편차 σ 대신에 표본 표준 편차 s 로 대치한 표본 평균의 표준화 확률 변수 T 는 다음과 같이 자유도가 n-1t-분포를 따르는 것이 알려져 있다.
T=¯Xμsnt(n1)
  • 따라서 모분산을 모르는 정규 모집단의 모평균에 대한 귀무 가설 H0:μ=μ0 를 검정하기 위한 검정 통계량은 다음과 같다.
T=¯Xμ0snt(n1)
  • 그러므로 모분산을 모르는 모집단 분포의 모평균에 대한 주장의 진위 여부를 검정하기 위해 자유도 n-1t-분포를 사용하며, 다음과 같은 순서로 구한다.
① 귀무 가설 H0 와 대립 가설 H1 을 설정한다.
② 유의 수준 α 를 정한다.
③ 검정 통계량 ¯Xμ0sn 를 선택한다.
④ 유의 수준 α 에 대한 임계값기각역을 구한다.
⑤ 표본으로부터 검정 통계량의 관찰값 t0 를 구하고, H0 의 채택과 기각 여부를 결정한다.
  • 이 때, 미리 주어진 유의 수준 α 에 대한 기각역 채택역에 대해 검정 통계량의 관찰값이 기각역 안에 있으면 귀무 가설 H0 를 기각하고, 그렇지 않으면 H0 를 기각하지 못한다.

 

단일 모평균에 대한 검정

  • 모분산 σ2 를 모르는 정규 모집단에서 모평균에 대한 귀무 가설 H0 와 대립 가설 H1 에 대해 다음과 같이 검정한다.

 

양측 검정

  • 귀무 가설 H0:μ=μ0 라는 주장과 이에 대립하는 대립 가설 H1:μμ0 를 검정하는 방법을 살펴보자.
  • 이 때, 사용하는 검정 통계량과 확률 분포는 다음과 같다.
T=¯Xμ0snt(n1)
  • 먼저 표본 평균의 관찰값 ¯x 와 표본 표준 편차 s 에 대해 검정 통계량의 관찰값 t0 를 구한다.
t0=¯xμ0sn
  • 그리고 유의 수준 α 에 대한 임계값 tα2(n1)t-분포표에서 찾으면 귀무 가설 H0 에 대한 기각역은 다음과 같다.
Ttα2(n1),Ttα2(n1)
  •  이 때, 검정 통계량의 관찰값 t0 기각역 안에 놓이면 귀무 가설 H0 를 기각한다.

 

예제 : 정규 모집단의 평균이 26.5 라는 주장을 알아보기 위해 표본 조사를 실시하여 다음을 얻었다. 이 주장에 대해 유의 수준 5%에서 검정하라.
표본 표본의 크기 표본 평균 표본 표준 편차
A 16 29 4.8
해설 보기

(1)

귀무 가설 H0:μ=26.5 와 대립 가설 H1:μ26.5 를 설정한다.


(2)

α=0.05 에 대해 t0.025(15)=2.131 이므로 기각역은 다음과 같다.

T2.131,T2.131

 

(3)

n=16,s=4.8 이므로 검정 통계량을 구하면 다음과 같다.

T=¯X26.54.8/16=¯X26.51.2

 

(4)

¯x=29 이므로 검정 통계량의 관찰값은 t0=2926.51.2=2.08 이다.

 

(5)

t0=2.08 이 기각역 안에 놓이지 않으므로 귀무 가설을 기각할 수 없다. 즉, 모평균이 26.5라는 주장은 근거가 충분하다.

 

상단측 검정

  • 귀무 가설 H0:μμ0 라는 주장과 이에 대립하는 대립 가설 H1:μ>μ0 를 검정하는 방법을 살펴보자.
  • 미리 설정된 유의 수준 α 에 대한 검정 통계량 T 에 대해 오른쪽 꼬리 확률이 α 인 임계점은 tα(n1) 이다.
  • 그리고 귀무 가설 H0 에 대한 기각역은 다음과 같으며, 검정 통계량의 관찰값 t0기각역 안에 놓이면 귀무 가설 H0 를 기각한다.
Ttα(n1)

 

예제 : 정규 모집단의 귀무 가설 H0:μ45 를 확인하기 위해 표본 조사를 실시하여 다음을 얻었다.
표본 표본의 크기 표본 평균 표본 표준 편차
A 25 46.2 2.75

(a) 이 주장에 대해 유의 수준 5%에서 검정하라.

(b) 이 주장에 대해 유의 수준 1%에서 검정하라.

해설 보기

[a]

유의 수준 α=0.05 에서 다음 순서에 따라 H0:μ45 를 검정한다.

 

(a-1)

귀무 가설 H0:μ=45 와 대립 가설 H1:μ>45 를 설정한다.


(a-2)

α=0.05 에 대해 t0.05(24)=1.711 이므로 기각역은 T1.711 이다.

 

(a-3)

n=25,s=2.75 이므로 검정 통계량을 구하면 다음과 같다.

T=¯X452.75/25=¯X450.55

 

(a-4)

¯x=46.2 이므로 검정 통계량의 관찰값은 t0=46.2450.55=2.182 이다.

 

(a-5)

t0=2.182 는 기각역 안에 놓이므로 귀무 가설을 기각한다.

 

[b]

유의 수준이 α=0.01 이므로 t0.01(24)=2.492 이다.

따라서 기각역은 T2.492 이고 관찰값 t0=2.182 는 기각역 안에 놓이지 않는다.

그러므로 귀무 가설을 기각할 수 없다.

 

하단측 검정

  • 귀무 가설 H0:μμ0 라는 주장과 이에 대립하는 대립 가설 H1:μ<μ0 를 검정하는 방법을 살펴보자.
  • 미리 설정된 유의 수준 α 에 대한 검정 통계량 T 에 대해 왼쪽 꼬리 확률이 α 인 임계점은 tα(n1) 이다.
  • 그리고 귀무 가설 H0 에 대한 기각역은 다음과 같으며, 검정 통계량의 관찰값 t0기각역 안에 놓이면 귀무 가설 H0 를 기각한다.
Ttα(n1)

 

예제 : 성인이 컴퓨터 화면에 있는 텍스트 한 쪽을 읽는 데 걸리는 시간은 평균 48초 이상이라고 한다. 이를 확인하기 위해 표본 조사를 실시하여 다음을 얻었다. 이 주장에 대해 유의 수준 5%에서 검정하라.
표본 표본의 크기 표본 평균 표본 표준 편차
A 15 46.2 3.84
해설 보기

(1)

귀무 가설 H0:μ48 과 대립 가설 H1:μ<48 를 설정한다.


(2)

α=0.05 에 대해 t0.05(14)=1.761 이므로 기각역은 T1.761 이다.

 

(3)

n=15,s=3.84 이므로 검정 통계량을 구하면 다음과 같다.

T=¯X483.84/15=¯X480.9915

 

(4)

¯x=46.2 이므로 검정 통계량의 관찰값은 t0=46.2480.9915=1.8154 이다.

 

(5)

t0=1.8154 는 기각역 안에 놓이므로 귀무 가설을 기각한다.

 

p-값을 이용한 검정 방법

  • 귀무 가설에 대한 타당성을 검정하기 위해 p-값을 이용한 방법은 다음과 같다.
① 귀무 가설 H0 와 대립 가설 H1 을 설정한다.
② 유의 수준 α 를 정한다.
③ 표본으로부터 표본 평균 ¯x 와 표본 표준 편차 s 를 구한다.
④ 검정 통계량 ¯Xμ0sn 를 선택하고, 관찰값 t0 를 구한다.
p-값을 구한다.
pα 이면 귀무 가설을 기각하고, p>α 이면 귀무 가설을 채택한다.
  • 그리고 모분산을 모르고 소표본(n<30)인 경우에 귀무 가설 H0 에 대한 검정은 다음과 같이 정리할 수 있다.
검정 방법 \ 가설과 기각역 귀무 가설 H0 대립 가설 H1 H0 의 기각역 p-값
하단측 검정 μμ0 μ<μ0 R:Ttα(n1) P(T<t0)
상단측 검정 μμ0 μ>μ0 R:Ttα(n1) P(T>t0)
양측 검정 μ=μ0 μμ0 R:|T|tα2(n1) P(|T|>t0)

 

예제 : 성인이 컴퓨터 화면에 있는 텍스트 한 쪽을 읽는 데 걸리는 시간은 평균 48초 이상이라고 한다. 이를 확인하기 위해 표본 조사를 실시하여 다음을 얻었다. 이에 대해 p-값을 구하고, 유의 수준 5%에서 검정하라.
표본 표본의 크기 표본 평균 표본 표준 편차
A 15 46.2 3.84
해설 보기

n=15 인 하단측 검정이고, 검정 통계량의 관찰값 t0=1.8154 를 얻었다. 

자유도 14인 t-분포표에서 t0.05(14)=1.761,t0.025=2.145 이므로 2.145<t0<1.761 이고 다음을 얻는다.

P(T1.761)=0.05,P(T2.145)=0.025

따라서 0.025<p<0.05 이고, p-값이 유의 수준 5% 보다 작으므로 귀무 가설을 기각한다.

 

두 모평균 차에 대한 검정

  • 독립이고 정규 분포를 따르는 두 모집단의 모분산 σ21σ22 이 알려지지 않은 경우에 두 모평균의 차 μ1μ2 에 대한 가설을 검정하는 방법을 살펴보자.
  • 이를 위해 각각 크기 nm 인 표본을 선정하면 모분산을 모르는 단일 모집단과 동일하게 t-분포를 사용하지만 다음과 같은 차이가 있다.
σ21=σ22=σ2 이고 σ2미지이다.
② 자유도 n+m2t-분포를 사용한다.
③ 표본 표준 편차 s 대신에 합동 표본 표준 편차 sp 를 사용한다.
  • 여기서 합동 표본 분산(Pooled Sample Variance)은 다음과 같이 정의한다.
S2p=1n+m2[ni=1(Xi¯X)2+mj=1(Yj¯Y)2]
  • 그리고 합동 표본 분산의 양의 제곱근합동 표본 표준 편차(Pooled Sample Standard Deviation)라 한다.
  • 특히 두 표본 분산을 각각 S21,S22 이라 하면 합동 표본 분산은 다음과 같이 간단히 구할 수 있다.
S2p=1n+m2[(n1)S21+(m1)S22]
  • 이 때, 귀무 가설 H0:μ1μ2=d0,H0:μ1μ2d0,H0:μ1μ2d0 를 검정하기 위해 사용하는 검정 통계량은 다음과 같다.
T=(¯X¯Y)d0sp1n+1m
  • 두 표본으로부터 얻은 표본 평균 ¯x¯Y 그리고 표본 분산 s21s22 에 의해 검정 통계량의 관찰값 t0 를 구한다.
  • 이 때, 관찰값 t0기각역 안에 놓이면 귀무 가설 H0 를 기각하고, 그렇지 않으면 H0 를 기각하지 않는다.
  • 한편 p-값을 구하여 p>α 이면 H0 를 채택하고, pα 이면 H0 를 기각한다.
  • 따라서 두 모분산을 모르는 경우에 모평균의 차 μ1μ2 에 대한 가설 검정의 유형에 대한 기각역과 p-값을 정리하면 다음과 같다.
검정 방법 \ 가설과 기각역 귀무 가설 H0 대립 가설 H1 H0 의 기각역 p-값
하단측 검정 μ1μ2d0 μ1μ2<d0 Ttα(n+m2) P(T<t0)
상단측 검정 μ1μ2d0 μ1μ2>d0 Ttα(n+m2) P(T>t0)
양측 검정 μ1μ2=d0 μ1μ2d0 |T|tα2(n+m2) 2[1P(T<t0)]

 

예제 : 독립인 두 정규 모집단의 모평균에 대해 μ1μ2=2 라는 주장을 검정하기 위해 표본을 선정하여 다음 결과를 얻었다. 이 주장에 대해 유의 수준 5%에서 검정하라.
표본 표본의 크기 표본 평균 표본 표준 편차
표본 1 10 ¯x=18.7 s1=2.4
표본 2 8 ¯y=14.2 s2=3.1
해설 보기

(1)

귀무 가설 H0:μ1μ2=2 와 대립 가설 H1:μ1μ22 를 설정한다.

 

(2) 

α=0.05 에 대해 t0.025(16)=2.12 이므로 기각역은 T2.12,T2.12 이다.

 

(3)

n=10,s1=2.4,m=8,s2=3.1 이므로 합동 표본 분산을 구하면 다음과 같다.

s2p=110+82(9×2.42+7×3.12)=7.4444

따라서 합동 표본 표준 편차는 sp=7.4444=2.728 이다.

 

(4)

검정 통계량을 구하면 다음과 같다.

T=(¯X¯Y)22.728×110+18=(¯X¯Y)21.294

 

(5)

¯x=18.7,¯y=14.2 이므로 검정 통계량의 관찰값은 t0=(18.714.2)21.294=1.932 이다.

 

(6)

t0=1.932 는 기각역 안에 놓이지 않으므로 귀무 가설을 기각할 수 없다.

 

728x90
728x90

모평균의 검정 (σ² : 미지)t-검정(t-Test)t- 분포(t-Distribution)특성t-분포표를 이용하여 백분위수 계산t-검정(t-Test)단일 모평균에 대한 검정양측 검정상단측 검정하단측 검정p-값을 이용한 검정 방법두 모평균 차에 대한 검정