728x90
728x90
모평균의 추정
- 대부분의 모집단은 분포를 비롯하여 모집단의 특성을 나타내는 모수가 알려져 있지 않다.
- 따라서 표본을 선정하여 얻은 정보를 이용하여 모집단의 모수를 과학적으로 추론할 필요가 있다.
- 이와 같이 모집단으로부터 선정한 표본을 통해 얻은 정보를 이용하여 미지의 모수를 추측하는 것을 추정(Estimate)이라 한다.
- 이 때, 모집단이 정규 분포를 따르면 표본의 크기 nn 에 관계 없이 표본 평균 ¯X¯¯¯¯¯X 는 정규 분포를 따른다.
- 그리고 모집단 분포가 정규 분포가 아닌 경우에도 표본의 크기 nn 이 충분히 크면 표본 평균 ¯X¯¯¯¯¯X 가 근사적으로 정규 분포를 따르는 것을 살펴보았다.
- 이 페이지에서는 모집단으로부터 표본을 선정하여 과학적인 방법으로 모평균을 추정하는 방법에 대해 알아본다.
모평균의 점추정
- 모분산 σ2σ2 이 알려져 있는 정규 모집단 N(μ,σ2)N(μ,σ2) 에서 모평균 μμ 를 추정하기 위해서는 다음과 같이 선정한 표본의 표본 평균 ¯x¯¯¯x 를 이용한다.

- 이 때, 표본 {X1,X2,⋯,Xn}{X1,X2,⋯,Xn} 의 관찰값인 x1,x2,⋯,xnx1,x2,⋯,xn 의 평균 ¯x¯¯¯x 를 이용하여 모평균 μμ 를 추정하는 과정을 점 추정(Point Estimate)이라 한다.
- 그리고 표본 평균 ¯X¯¯¯¯¯X 를 모평균 μμ 에 대한 점 추정량(Point Estimator)이라 하고, 관찰값의 평균 ¯x¯¯¯x 를 μμ 에 대한 점 추정값(Value of Point Estimate)이라 한다.
예제 : 분산이 4인 정규 모집단의 평균을 추정하기 위해 표본을 선정하여 다음을 얻었다. 이 때, 모평균 μμ 에 대한 점 추정값을 구하라.
72 | 71 | 71 | 73 | 76 | 71 | 68 | 70 | 71 | 74 |
해설 보기
모평균 μμ 를 추정하기 위해 표본 평균 ¯x¯¯¯x 를 이용하여 모평균에 대한 점 추정값을 구하면 다음과 같다.
¯x=110(72+71+71+73+76+71+68+70+71+74)=71.7¯¯¯x=110(72+71+71+73+76+71+68+70+71+74)=71.7
모평균의 신뢰 구간
- 모평균의 점 추정은 모집단으로부터 표본을 어떻게 선정하느냐에 따라 점 추정값이 다르게 나타날 뿐만 아니라 모평균의 참값을 왜곡하는 경우가 발생할 수도 있다.
- 이러한 오류를 방지하기 위해 모평균의 참값이 포함될 것으로 믿어지는 구간을 추정한다.
- 이와 같이 모평균 μμ 의 참값이 포함될 것으로 믿어지는 구간을 추정하는 방법을 구간 추정(Interval Estimate)이라 한다.
- 모평균 μμ 에 대한 구간 추정을 구하기 위해서는 μμ 의 참값이 포함될 확률이 1−α,0<α<11−α,0<α<1 이 되도록 추정값 ¯x1¯¯¯¯¯x1 과 ¯x2¯¯¯¯¯x2 를 구한다.
P(¯x1≤μ≤¯x2)=1−αP(¯¯¯¯¯x1≤μ≤¯¯¯¯¯x2)=1−α |
- 그러면 모평균 μμ 의 참값을 포함하는 모든 구간 (¯x1,¯x2)(¯¯¯¯¯x1,¯¯¯¯¯x2) 를 100(1−α)100(1−α)% 신뢰 구간(Confidence Interval)이라 하며, 모수의 참값이 이 구간에 포함될 것으로 믿어지는 확신의 정도인 100(1−α)100(1−α)% 를 신뢰도(Degree of Confidence)라 한다.
- 이 때, α=0.1,0.05,0.01α=0.1,0.05,0.01 인 경우, 즉 90%, 95%, 99% 신뢰도를 사용하며, 신뢰 구간의 중심은 표본 평균 ¯x¯¯¯x 를 이용한다.
- 특히 신뢰도가 커질수록 다음과 같이 신뢰 구간은 커진다.

- 한편, 모집단이 정규 분포 N(μ,σ2)N(μ,σ2) 를 따르면, 표본 평균 ¯X¯¯¯¯¯X 는 근사적으로 정규 분포 N(μ,σ2n)N(μ,σ2n) 를 따른다. (관련 내용 바로가기)
- 따라서 ¯X¯¯¯¯¯X 를 표준화한 확률 변수 Z=¯X−μσ√nZ=¯¯¯¯¯X−μσ√n 는 표준 정규 분포 N(0,1)N(0,1) 을 따른다.
- 그리고 표준 정규 분포에서 양쪽 꼬리 확률이 각각 α2α2 인 임계점은 다음과 같이 각각 −zα2−zα2 와 zα2zα2 이다.

- 따라서 표본 평균 ¯X¯¯¯¯¯X 의 표준화 확률 변수 ZZ 로부터 다음을 얻는다.
P(|Z|≤zα2)=1−αP(|¯X−μσ√n|≤zα2)=P(|¯X−μ|)≤zα2σ√n=1−αP(¯X−zα2σ√n≤μ≤¯X+zα2σ√n)=1−α |
- 이 때, 표본 평균 ¯X 의 관찰값을 ¯x 라 하면, 모평균 μ 에 대한 100(1−α)% 신뢰 구간은 다음과 같다.
¯x−zα2σ√n≤μ≤¯x+zα2σ√n
- 표준 정규 분포의 양쪽 꼬리 확률이 각각 α2=0.05,0.025,0.005 가 되는 백분위수는 z0.05=1.645,z0.025=1.96,z0.005=2.58 이고, 이에 대한 중심 확률 P(|Z|<zα2 는 각각 다음과 같다. (관련 내용 바로가기)
P(|Z|<1.645)=0.9,P(|Z|<1.96)=0.95,P(|Z|<2.58)=0.99 |
- 그러므로 모분산 σ2 을 알고 있는 정규 모집단의 모평균 μ 에 대한 90%, 95%, 99% 신뢰 구간은 각각 다음과 같다.
- 90% 신뢰 구간 : ¯x−1.645σ√n≤μ≤¯x+1.645σ√n
- 95% 신뢰 구간 : ¯x−1.96σ√n≤μ≤¯x+1.96σ√n
- 99% 신뢰 구간 : ¯x−2.58σ√n≤μ≤¯x+2.58σ√n
예제 : σ2=9 인 정규 모집단의 모평균을 추정하기 위해 크기 25인 표본을 추출했다. 표본 평균이 30일 때, 모평균에 대한 95% 신뢰 구간을 구하라.
해설 보기
¯x=30,σ2=9,n=25 이므로 모평균 μ 에 대한 95% 신뢰 구간을 구하면 다음과 같다.
30−1.963√25≤μ≤30+1.963√2530−1.176≤μ≤30+1.17628.824≤μ≤31.176 |
- 일반적으로 모집단은 매우 많은 자료로 구성되므로 모분산이 알려지는 경우가 거의 없다.
- 그러나 표본의 크기 n 이 충분히 크면 s2≈σ2 인 사실이 밝혀져 있다.
- 따라서 표본 평균 ¯X 에 대해 다음과 같은 근사적인 확률 분포가 성립한다.
¯X≈N(μ,s2n) 또는 ¯X−μs√n≈N(0,1) |
- 그러므로 모분산이 알려져 있지 않으나 n 이 충분히 크면 σ2 을 s2 으로 대치하여 다음의 근사 신뢰 구간을 구할 수 있다.
- 90% 근사 신뢰 구간 : ¯x−1.645s√n≤μ≤¯x+1.645s√n
- 95% 근사 신뢰 구간 : ¯x−1.96s√n≤μ≤¯x+1.96s√n
- 99% 근사 신뢰 구간 : ¯x−2.58s√n≤μ≤¯x+2.58s√n
예제 : 정규 모집단의 모평균을 추정하기 위해 크기 125인 표본을 추출했다. 표본 평균 75, 표본 표준 편차 9를 얻었다. 이때 모평균에 대한 95% 근사 신뢰 구간을 구하라.
해설 보기
¯x=75,s=9,n=125 이므로 모평균 μ 에 대한 95% 근사 신뢰 구간을 구하면 다음과 같다.
75−1.969√125≤μ≤75+1.969√12575−1.58≤μ≤75+1.5873.42≤μ≤76.58 |
두 모평균 차의 신뢰 구간
- 독립인 두 정규 모집단 N(μ1,σ21) 과 N(μ2,σ22) 의 모분산 σ21 과 σ22 이 알려져 있다고 하자.
- 이 때, 두 모평균의 차 μ1−μ2 에 대한 신뢰 구간을 살펴보자.
- 우선 두 모집단에서 각각 크기가 n 과 m 인 표본의 표본 평균을 각각 ¯X,¯Y 라 하자.
- 그러면 두 표본 평균은 독립이고 각각 다음 정규 분포를 따른다.
¯X∼N(μ1,σ21n),¯Y∼N(μ2,σ22m) |
- 따라서 두 표본 평균의 차 ¯X−¯Y 는 다음 정규 분포를 따른다. (관련 내용 바로가기)
¯X−¯Y∼N(μ1−μ2,σ21n+σ21m) |
- 그리고 ¯X−¯Y 의 표준화 확률 변수 Z 는 다음 표준 정규 분포를 따른다.
Z=(¯X−¯Y)−(μ1−μ2)√σ21n+σ22m∼N(0,1) |
- 그러면 양쪽 꼬리 확률이 각각 α2 인 백분위수 −zα2 와 zα2 에 대해 다음이 성립한다.
P(|Z|≤zα2)=1−αP(−zα2≤(¯X−¯Y)−(μ1−μ2)√σ21n+σ22m≤zα2)=1−αP((¯X−¯Y)−zα2√σ21n+σ22m≤μ1−μ2≤(¯X−¯Y)+zα2√σ21n+σ22m)=1−α |
- 따라서 두 모평균의 차 μ1−μ2 에 대한 90%, 95%, 99% 신뢰 구간은 다음과 같다.
- 90% 신뢰 구간 : (¯x−¯y)−1.645√σ21n+σ22m≤μ1−μ2≤(¯x−¯y)+1.645√σ21n+σ22m
- 95% 신뢰 구간 : (¯x−¯y)−1.96√σ21n+σ22m≤μ1−μ2≤(¯x−¯y)+1.96√σ21n+σ22m
- 99% 신뢰 구간 : (¯x−¯y)−2.58√σ21n+σ22m≤μ1−μ2≤(¯x−¯y)+2.58√σ21n+σ22m
- 두 정규 모집단의 모분산이 알려지지 않은 경우에는 각각 충분히 큰 n 과 m 에 대해 s21≈σ21,s22≈σ22 이므로 σ21 과 σ22 를 각각 s21 과 s22 으로 대치하여 다음의 근사 신뢰 구간을 구할 수 있다.
- 90% 근사 신뢰 구간 : (¯x−¯y)−1.645√s21n+s22m≤μ1−μ2≤(¯x−¯y)+1.645√s21n+s22m
- 95% 근사 신뢰 구간 : (¯x−¯y)−1.96√s21n+s22m≤μ1−μ2≤(¯x−¯y)+1.96√s21n+s22m
- 99% 근사 신뢰 구간 : (¯x−¯y)−2.58√s21n+s22m≤μ1−μ2≤(¯x−¯y)+2.58√s21n+s22m
예제 : 남성과 여성의 평균 월급에 차이가 있는지 살펴보기 위해 표본을 선정하여 조사한 결과, 다음을 얻었다. 남성과 여성의 평균 월급의 차에 대한 95% 신뢰 구간을 구하라. 단, 월급은 정규 분포를 따른다고 한다.
구분 | 인원 | 평균 월급 | 표준 편차 |
남성 근로자 | 56 | 261.6만원 | 21.5만원 |
여성 근로자 | 44 | 254.4만원 | 14.3만원 |
해설 보기
¯x=261.6,s21=21.5,n=56,¯y=254.4,s22=14.3,m=44 이므로 다음을 얻는다.
¯x−¯y=261.6−254.4=7.2,1.96×√21.5256+14.3244≒7.04
따라서 모평균 μ1−μ2 에 대한 95% 근사 신뢰 구간을 구하면 다음과 같다.
7.2−7.04≤μ≤7.2+7.040.16≤μ≤14.24
728x90
728x90
'Mathematics > 확률과 통계' 카테고리의 다른 글
[확률과 통계] 모평균의 검정 (σ² : 미지) (0) | 2022.12.01 |
---|---|
[확률과 통계] 모평균의 검정(σ² : 기지) (0) | 2022.11.30 |
[확률과 통계] 통계적 가설 검정 (0) | 2022.11.28 |
[확률과 통계] 모비율의 추정 (0) | 2022.11.28 |
[확률과 통계] 모집단과 표본 (0) | 2022.11.21 |
[확률과 통계] 연속 확률 분포 (0) | 2022.11.21 |
[확률과 통계] 이산 확률 분포 (0) | 2022.11.14 |
[확률과 통계] 확률 변수의 평균과 분산 (0) | 2022.11.14 |