728x90
728x90
통계적 가설 검정
- 어느 학원에서 합격률이 전국 최고인 85.4% 라는 광고를 한다고 하자. 그러면 이 학원의 주장이 참인지 아니면 거짓인지 확인할 필요가 있을 것이다.
- 이와 같이 모수에 대한 주장을 검정하기 위해 반대인 주장을 설정하고, 어느 주장이 참인지 검정하는 일반적인 방법을 살펴본다.
가설 검정의 의미
- 합격률이 전국 최고인 85.4% 라는 광고가 참인지 확인하기 위해서는, 이 주장을 타당한 것으로 인정하고 이와 반대되는 주장을 설정한다.
- 그리고 이러한 두 주장 중에서 어느 것이 참인지 결정해야 한다.
- 이 때, 임의로 표본을 선정하고, 검정을 위한 표본 통계량을 이용하여 얻은 정보를 근거로 어느 주장이 참인지 판정한다.
- 이와 같이 참인지 거짓인지 명확히 밝히고자 하는 모수에 대한 주장을 가설(Hypothesis)이라 한다.
- 그리고 표본으로부터 얻은 통계량을 이용하여 모수에 대한 주장의 진위 여부를 검정하는 과정을 가설 검정(Hypothesis Testing)이라 한다.
- 이 때, "합격률이 85.4%이다." 라는 주장과 이에 반대되는 주장인 "합격률이 85.4%가 아니다." 를 설정한다.
- 학원 측의 주장과 같이 통계적으로 검증받아야 할 주장을 귀무 가설이라 하고, 귀무 가설을 부정하는 가설을 대립 가설이라 한다.
귀무 가설(Null Hypothesis)와 대립 가설(Alternative Hypothesis)
- 귀무 가설(Null Hypothesis) : 거짓이 명확히 구명될 때까지 참인 것으로 인정되는 모수에 대한 주장
- 대립 가설(Alternative Hypothesis) : 귀무 가설이 거짓이라면 참이 되는 가설
- 귀무 가설은 타당성을 입증해야 할 가설을 의미하고 로 나타낸다.
- 대립 가설은 귀무 가설을 부정하는 새로운 가설을 의미하고 으로 나타낸다.
- 귀무 가설에는 항상 등호() 를 사용하고, 대립 가설에는 등호를 사용하지 않는다.
- 예를 들어, 합격률 에 대한 귀무 가설은 다음과 같다.
- 그리고 이에 반대되는 대립 가설은 각각 다음과 같다.
- 한편, 임의로 선정한 표본을 이용하여 귀무 가설 의 진위 여부를 검정하며, 검정을 위해 사용하는 표본 통계량을 검정 통계량이라고 한다.
검정 통계량(Test Statistic)
귀무 가설 의 진위 여부를 판정하기 위해 표본으로부터 얻은 통계량
- 검정 통계량의 관찰값을 이용하여 귀무 가설이 거짓으로 판정된다면 귀무 가설 를 기각(Reject)한다고 한다.
- 그리고 귀무 가설을 부정하지 못하는 경우에는 귀무 가설 를 채택(Accept)한다고 한다.
- 이 때, 귀무 가설을 기각하는 검정 통계량의 영역을 기각역이라 하고, 반대로 귀무 가설을 채택하는 영역을 채택역이라고 한다.
채택역(Acceptance Region)과 기각역(Critical Region)
- 채택역(Acceptance Region) : 귀무 가설 를 채택하는 검정 통계량의 영역(범위)
- 기각역(Critical Region) : 귀무 가설 를 기각하는 검정 통계량의 영역(범위)
- 한편, 표본을 아무리 공정하게 선정하더라도 귀무 가설 가 실제로 참이지만 검정 결과는 참 또는 거짓으로 판정하는 경우가 발생한다.
- 그리고 반대로 가 실제로 거짓이지만 검정 결과는 참 또는 거짓으로 판정하는 경우가 발생한다.
- 이 때, 실제로 가 참(또는 거짓)이고 검정 결과도 를 채택(또는 기각)한다면 올바른 결정을 하게 된다.
- 그러나 가 실제로 참이지만, 검정한 결과 를 기각한다거나, 반대로 가 실제로 거짓이지만 검정한 결과 를 채택한다면 오류를 범하게 된다.
- 이 때, 다음과 같이 참인 귀무 가설을 기각함으로써 발생하는 오류를 제1종 오류, 거짓인 귀무 가설을 채택함으로써 발생하는 오류를 제2종 오류라 한다.
검정 결과 \ 실제 | 가 참 | 가 거짓 |
를 채택 | 올바른 결정 | 제2종 오류 |
를 기각 | 제1종 오류 | 올바른 결정 |
- 그리고 제1종 오류를 범할 확률의 최대 허용 한계를 유의 수준이라 하며, 전통적으로 유의 수준 는 0.01(1%), 0.05(5%), 0.1(10%)을 많이 사용한다.
- 유의 수준 라 함은 원칙적으로 기각할 것을 예상하여 설정한 가설을 기각한다고 하더라도, 그것에 의한 오차가 최대 5%임을 나타낸다.
제1종 오류(Type I Error)와 유의 수준(Significance Level)
- 제1종 오류(Type I Error) : 귀무 가설 가 참이지만 검정 결과 귀무 가설을 기각함으로써 발생하는 오류
- 유의 수준(Significance Level) : 제1종 오류를 범할 확률
기각역을 이용한 검정 방법
- 귀무 가설 에 대한 주장, 즉 모평균 또는 모비율 와 같은 모수 에 대한 주장은 부등호() 또는 등호() 를 사용한다.
- 따라서 이러한 귀무 가설에 대립되는 대립 가설 을 설정하며, 각 경우의 검정 유형은 다음과 같다.
검정 유형 | 귀무 가설 | 대립 가설 |
양측 검정 | ||
상단측 검정 | ||
하단측 검정 |
- 그러면 귀무 가설은 다음 순서에 따라 검정한다.
① 귀무 가설 와 대립 가설 을 설정한다.
② 유의 수준 를 정한다.
③ 적당한 검정 통계량을 선택한다.
④ 유의 수준 에 대한 임계값과 기각역을 구한다.
⑤ 검정 통계량의 관찰값을 구하여, 이 값이 기각역 안에 놓이면 를 기각한다.
- 이 때, 미리 주어진 유의 수준 에 대한 검정 유형별 의 기각역과 채택역은 다음과 같다.

- 검정 통계량의 관찰값이 기각역 안에 놓이면 를 기각하고, 관찰값이 채택역 안에 놓이면, 를 기각하지 못한다.
양측 검정(Two Sided Hypothesis)
- 두 가설 에 대해 유의 수준을 라 하자.
- 그러면 양쪽 꼬리 확률이 각각 가 되는 두 임계값 에 대해 기각역은 다음과 같다.
- 즉, 양측 검정의 기각역과 채택역은 다음 그림과 같다.

- 따라서 검정 통계량의 관찰값 에 대해 또는 이면 를 기각하고 이면 를 기각하지 못한다.
- 이 때, 채택역은 신뢰도 % 신뢰 구간과 일치한다.
상단측 검정(One Sided Upper Hypothesis)
- 두 가설 에 대해 유의 수준을 라 하자.
- 그러면 위쪽 꼬리 확률이 가 되는 임계값 에 대해 기각역은 다음과 같다.
- 즉, 상단측 검정의 기각역과 채택역은 다음 그림과 같다.

- 따라서 검정 통계량의 관찰값 에 대해 이면 를 기각하고, 이면 을 기각하지 못한다.
하단측 검정(One Sided Lower Hypothesis)
- 두 가설 에 대해 유의 수준을 라 하자.
- 그러면 아래쪽 꼬리 확률이 가 되는 임계값 에 대해 기각역은 다음과 같다.
- 즉, 하단측 검정의 기각역과 채택역은 다음 그림과 같다.

- 따라서 검정 통계량의 관찰값 에 대해 이면 를 기각하고, 이면 을 기각하지 못한다.
-값을 이용한 검정 방법
- 기각역을 이용하여 의 기각 또는 채택을 결정하는 방법 이외에 -값을 이용하는 방법이 있다.
- 예를 들어, 귀무 가설 에 대한 상단측 검정에서 검정 통계량의 관찰값이 라 하자.
- 그러면 다음과 같이 유의 수준이 % 이면 기각역은 이고 관찰값 이 기각역 안에 들어가므로 유의 수준 5% 에서 귀무 가설을 기각한다.

- 그러나 유의 수준을 % 라 하면 기각역이 이므로 관찰값 가 채택역 안에 들어가고, 유의 수준 1%에서 귀무 가설을 기각할 수 없다.
- 이 때, 관찰값 에 의해 귀무 가설 를 기각시킬 가장 작은 확률은 이고, 이 확률은 를 기각시킬 가장 작은 유의 수준이다.
- 이와 같이 를 기각시킬 가장 작은 유의 수준을 -값이라 한다.
- 그러면 관찰값 에 대해 임을 알 수 있다.
-값
귀무 가설 를 참이라고 가정할 때, 관찰값에 의해 를 기각시키는 가장 작은 유의 수준
- 따라서 -값이 주어진 유의 수준보다 작으면 귀무 가설 를 기각하고, -값이 유의 수준보다 크면 를 기각할 수 없다.
- 그러면 -값과 유의 수준 에 따른 귀무 가설 의 기각 및 채택을 정리하면 다음과 같다.
-값 | 유의 수준() | ||
10% | 5% | 1% | |
를 채택 | 를 채택 | 를 채택 | |
를 기각 | 를 채택 | 를 채택 | |
를 기각 | 를 기각 | 를 채택 | |
를 기각 | 를 기각 | 를 기각 |
- 귀무 가설에 대한 타당성을 검정할 때, -값을 이용한 방법은 다음과 같다.
① 귀무 가설 와 대립 가설 을 설정한다.
② 유의 수준 를 정한다.
③ 적당한 검정 통계량을 선택한다.
④ -값을 구한다.
⑤ 이면 귀무 가설을 기각하고, 이면 귀무 가설을 채택한다.
728x90
728x90
'Mathematics > 확률과 통계' 카테고리의 다른 글
[확률과 통계] 모비율의 검정 (0) | 2022.12.01 |
---|---|
[확률과 통계] 모평균의 검정 (σ² : 미지) (0) | 2022.12.01 |
[확률과 통계] 모평균의 검정(σ² : 기지) (0) | 2022.11.30 |
[확률과 통계] 모비율의 추정 (0) | 2022.11.28 |
[확률과 통계] 모평균의 추정 (0) | 2022.11.27 |
[확률과 통계] 모집단과 표본 (0) | 2022.11.21 |
[확률과 통계] 연속 확률 분포 (0) | 2022.11.21 |
[확률과 통계] 이산 확률 분포 (0) | 2022.11.14 |