728x90
728x90

모평균의 추정

  • 대부분의 모집단은 분포를 비롯하여 모집단의 특성을 나타내는 모수가 알려져 있지 않다.
  • 따라서 표본을 선정하여 얻은 정보를 이용하여 모집단의 모수를 과학적으로 추론할 필요가 있다.
  • 이와 같이 모집단으로부터 선정한 표본을 통해 얻은 정보를 이용하여 미지의 모수를 추측하는 것 추정(Estimate)이라 한다.
  • 이 때, 모집단이 정규 분포를 따르면 표본의 크기 nn 에 관계 없이 표본 평균 ¯X¯¯¯¯¯X정규 분포를 따른다.
  • 그리고 모집단 분포가 정규 분포가 아닌 경우에도 표본의 크기 nn 이 충분히 크면 표본 평균 ¯X¯¯¯¯¯X 가 근사적으로 정규 분포를 따르는 것을 살펴보았다.
  • 이 페이지에서는 모집단으로부터 표본을 선정하여 과학적인 방법으로 모평균을 추정하는 방법에 대해 알아본다.

 

모평균의 점추정

  • 모분산 σ2σ2 이 알려져 있는 정규 모집단 N(μ,σ2)N(μ,σ2) 에서 모평균 μμ 를 추정하기 위해서는 다음과 같이 선정한 표본의 표본 평균 ¯x¯¯¯x 를 이용한다.

모수의 추론 과정

  • 이 때, 표본 {X1,X2,,Xn}{X1,X2,,Xn} 의 관찰값인 x1,x2,,xnx1,x2,,xn 의 평균 ¯x¯¯¯x 를 이용하여 모평균 μμ 를 추정하는 과정을 점 추정(Point Estimate)이라 한다.
  • 그리고 표본 평균 ¯X¯¯¯¯¯X 를 모평균 μμ 에 대한 점 추정량(Point Estimator)이라 하고, 관찰값의 평균 ¯x¯¯¯xμμ 에 대한 점 추정값(Value of Point Estimate)이라 한다.

 

예제 : 분산이 4인 정규 모집단의 평균을 추정하기 위해 표본을 선정하여 다음을 얻었다. 이 때, 모평균 μμ 에 대한 점 추정값을 구하라.
72 71 71 73 76 71 68 70 71 74
해설 보기

모평균 μμ 를 추정하기 위해 표본 평균 ¯x¯¯¯x 를 이용하여 모평균에 대한 점 추정값을 구하면 다음과 같다.

¯x=110(72+71+71+73+76+71+68+70+71+74)=71.7¯¯¯x=110(72+71+71+73+76+71+68+70+71+74)=71.7

 

모평균의 신뢰 구간

  • 모평균의 점 추정은 모집단으로부터 표본을 어떻게 선정하느냐에 따라 점 추정값이 다르게 나타날 뿐만 아니라 모평균의 참값을 왜곡하는 경우가 발생할 수도 있다.
  • 이러한 오류를 방지하기 위해 모평균의 참값이 포함될 것으로 믿어지는 구간을 추정한다.
  • 이와 같이 모평균 μμ 의 참값이 포함될 것으로 믿어지는 구간을 추정하는 방법구간 추정(Interval Estimate)이라 한다.
  • 모평균 μμ 에 대한 구간 추정을 구하기 위해서는 μμ 의 참값이 포함될 확률이 1α,0<α<11α,0<α<1 이 되도록 추정값 ¯x1¯¯¯¯¯x1¯x2¯¯¯¯¯x2 를 구한다.
P(¯x1μ¯x2)=1αP(¯¯¯¯¯x1μ¯¯¯¯¯x2)=1α
  • 그러면 모평균 μμ 의 참값을 포함하는 모든 구간 (¯x1,¯x2)(¯¯¯¯¯x1,¯¯¯¯¯x2)100(1α)100(1α)% 신뢰 구간(Confidence Interval)이라 하며, 모수의 참값이 이 구간에 포함될 것으로 믿어지는 확신의 정도인 100(1α)100(1α)% 를 신뢰도(Degree of Confidence)라 한다.
  • 이 때, α=0.1,0.05,0.01α=0.1,0.05,0.01 인 경우, 즉 90%, 95%, 99% 신뢰도를 사용하며, 신뢰 구간의 중심은 표본 평균 ¯x¯¯¯x 를 이용한다.
  • 특히 신뢰도가 커질수록 다음과 같이 신뢰 구간은 커진다.

신뢰도에 따른 신뢰 구간의 비교

  • 한편, 모집단이 정규 분포 N(μ,σ2)N(μ,σ2) 를 따르면, 표본 평균 ¯X¯¯¯¯¯X 는 근사적으로 정규 분포 N(μ,σ2n)N(μ,σ2n) 를 따른다. (관련 내용 바로가기)
  • 따라서 ¯X¯¯¯¯¯X 를 표준화한 확률 변수 Z=¯XμσnZ=¯¯¯¯¯Xμσn 는 표준 정규 분포 N(0,1)N(0,1) 을 따른다.
  • 그리고 표준 정규 분포에서 양쪽 꼬리 확률이 각각 α2α2 인 임계점은 다음과 같이 각각 zα2zα2zα2zα2 이다.

꼬리 확률과 백분위수

  • 따라서 표본 평균 ¯X¯¯¯¯¯X 의 표준화 확률 변수 ZZ 로부터 다음을 얻는다.
P(|Z|zα2)=1αP(|¯Xμσn|zα2)=P(|¯Xμ|)zα2σn=1αP(¯Xzα2σnμ¯X+zα2σn)=1α
  • 이 때, 표본 평균 ¯X 의 관찰값을 ¯x 라 하면, 모평균 μ 에 대한 100(1α)% 신뢰 구간은 다음과 같다.
¯xzα2σnμ¯x+zα2σn
  • 표준 정규 분포의 양쪽 꼬리 확률이 각각 α2=0.05,0.025,0.005 가 되는 백분위수는 z0.05=1.645,z0.025=1.96,z0.005=2.58 이고, 이에 대한 중심 확률 P(|Z|<zα2 는 각각 다음과 같다. (관련 내용 바로가기)
P(|Z|<1.645)=0.9,P(|Z|<1.96)=0.95,P(|Z|<2.58)=0.99
  • 그러므로 모분산 σ2 을 알고 있는 정규 모집단의 모평균 μ 에 대한 90%, 95%, 99% 신뢰 구간은 각각 다음과 같다.
- 90% 신뢰 구간 :    ¯x1.645σnμ¯x+1.645σn

- 95% 신뢰 구간 :    ¯x1.96σnμ¯x+1.96σn

- 99% 신뢰 구간 :    ¯x2.58σnμ¯x+2.58σn

 

예제 : σ2=9 인 정규 모집단의 모평균을 추정하기 위해 크기 25인 표본을 추출했다. 표본 평균이 30일 때, 모평균에 대한 95% 신뢰 구간을 구하라.
해설 보기

¯x=30,σ2=9,n=25 이므로 모평균 μ 에 대한 95% 신뢰 구간을 구하면 다음과 같다.

301.96325μ30+1.96325301.176μ30+1.17628.824μ31.176

 

  • 일반적으로 모집단은 매우 많은 자료로 구성되므로 모분산이 알려지는 경우가 거의 없다.
  • 그러나 표본의 크기 n 이 충분히 크면 s2σ2 인 사실이 밝혀져 있다.
  • 따라서 표본 평균 ¯X 에 대해 다음과 같은 근사적인 확률 분포가 성립한다.
¯XN(μ,s2n) 또는 ¯XμsnN(0,1)
  • 그러므로 모분산이 알려져 있지 않으나 n 이 충분히 크면 σ2s2 으로 대치하여 다음의 근사 신뢰 구간을 구할 수 있다.
- 90% 근사 신뢰 구간 :    ¯x1.645snμ¯x+1.645sn

- 95% 근사 신뢰 구간 :    ¯x1.96snμ¯x+1.96sn

- 99% 근사 신뢰 구간 :    ¯x2.58snμ¯x+2.58sn

 

예제 : 정규 모집단의 모평균을 추정하기 위해 크기 125인 표본을 추출했다. 표본 평균 75, 표본 표준 편차 9를 얻었다. 이때 모평균에 대한 95% 근사 신뢰 구간을 구하라.
해설 보기

¯x=75,s=9,n=125 이므로 모평균 μ 에 대한 95% 근사 신뢰 구간을 구하면 다음과 같다.

751.969125μ75+1.969125751.58μ75+1.5873.42μ76.58

 

두 모평균 차의 신뢰 구간

  • 독립인 두 정규 모집단 N(μ1,σ21)N(μ2,σ22) 의 모분산 σ21σ22 이 알려져 있다고 하자.
  • 이 때, 두 모평균의 차 μ1μ2 에 대한 신뢰 구간을 살펴보자.
  • 우선 두 모집단에서 각각 크기가 nm 인 표본의 표본 평균을 각각 ¯X,¯Y 라 하자.
  • 그러면 두 표본 평균은 독립이고 각각 다음 정규 분포를 따른다.
¯XN(μ1,σ21n),¯YN(μ2,σ22m)
  • 따라서 두 표본 평균의 차 ¯X¯Y 는 다음 정규 분포를 따른다. (관련 내용 바로가기)
¯X¯YN(μ1μ2,σ21n+σ21m)
  • 그리고 ¯X¯Y 의 표준화 확률 변수 Z 는 다음 표준 정규 분포를 따른다.
Z=(¯X¯Y)(μ1μ2)σ21n+σ22mN(0,1)
  • 그러면 양쪽 꼬리 확률이 각각 α2 인 백분위수 zα2zα2 에 대해 다음이 성립한다.
P(|Z|zα2)=1αP(zα2(¯X¯Y)(μ1μ2)σ21n+σ22mzα2)=1αP((¯X¯Y)zα2σ21n+σ22mμ1μ2(¯X¯Y)+zα2σ21n+σ22m)=1α
  • 따라서 두 모평균의 차 μ1μ2 에 대한 90%, 95%, 99% 신뢰 구간은 다음과 같다.
- 90% 신뢰 구간 :    (¯x¯y)1.645σ21n+σ22mμ1μ2(¯x¯y)+1.645σ21n+σ22m

- 95% 신뢰 구간 :    (¯x¯y)1.96σ21n+σ22mμ1μ2(¯x¯y)+1.96σ21n+σ22m

- 99% 신뢰 구간 :    (¯x¯y)2.58σ21n+σ22mμ1μ2(¯x¯y)+2.58σ21n+σ22m
  • 두 정규 모집단의 모분산이 알려지지 않은 경우에는 각각 충분히 큰 nm 에 대해 s21σ21,s22σ22 이므로 σ21σ22 를 각각 s21s22 으로 대치하여 다음의 근사 신뢰 구간을 구할 수 있다.
- 90% 근사 신뢰 구간 :    (¯x¯y)1.645s21n+s22mμ1μ2(¯x¯y)+1.645s21n+s22m

- 95% 근사 신뢰 구간 :    (¯x¯y)1.96s21n+s22mμ1μ2(¯x¯y)+1.96s21n+s22m

- 99% 근사 신뢰 구간 :    (¯x¯y)2.58s21n+s22mμ1μ2(¯x¯y)+2.58s21n+s22m

 

예제 : 남성과 여성의 평균 월급에 차이가 있는지 살펴보기 위해 표본을 선정하여 조사한 결과, 다음을 얻었다. 남성과 여성의 평균 월급의 차에 대한 95% 신뢰 구간을 구하라. 단, 월급은 정규 분포를 따른다고 한다.
구분 인원 평균 월급 표준 편차
남성 근로자 56 261.6만원 21.5만원
여성 근로자 44 254.4만원 14.3만원
해설 보기

¯x=261.6,s21=21.5,n=56,¯y=254.4,s22=14.3,m=44 이므로 다음을 얻는다.

¯x¯y=261.6254.4=7.2,1.96×21.5256+14.32447.04

 

따라서 모평균 μ1μ2 에 대한 95% 근사 신뢰 구간을 구하면 다음과 같다.

7.27.04μ7.2+7.040.16μ14.24

 

728x90
728x90

모평균의 추정모평균의 점추정모평균의 신뢰 구간두 모평균 차의 신뢰 구간