도수 분포표에서의 평균과 분산
- 도수 분포표로 주어진 자료는 각 계급 안의 도수는 알지만 정확한 자료값을 알지 못한다. 이런 경우에는 각 계급의 계급값을 이용하여 대푯값으로 생각한다.
- 예) 계급 간격이 9.5 ~ 18.5인 계급의 도수가 10이면, 이 계급 안의 정확한 자료값을 알 수 없으므로 10개의 자료값을 계급값 14로 생각한다.
도수 분포표에서의 평균
- 도수 분포표에서 주어진 자료의 평균을 구하기 위해 각 계급의 계급값을 이용한다.
예
10 | 37 | 22 | 32 | 18 | 15 | 15 | 18 | 22 | 15 |
20 | 25 | 38 | 28 | 25 | 30 | 20 | 22 | 18 | 22 |
22 | 12 | 22 | 26 | 22 | 32 | 22 | 23 | 20 | 23 |
23 | 20 | 25 | 51 | 20 | 25 | 26 | 22 | 26 | 28 |
28 | 20 | 23 | 30 | 12 | 22 | 35 | 11 | 20 | 25 |
- 위의 자료의 평균을 구하면 $\overline{x} = 23.36$ 이다.
- 이 자료에 대해 계급의 수가 5인 도수 분포표를 구하면 다음과 같으며, 이 도수 분포표에는 각 계급 안에 들어있는 자료의 수는 알 수 있지만, 정확한 자료값은 알 수 없다.
계급 간격 | 도수(`f_{i}`) | 상대 도수 | 계급값(`x_{i}`) |
9.5 ~ 18.5 | 10 | 0.20 | 14 |
18.5 ~ 27.5 | 29 | 0.58 | 23 |
27.5 ~ 36.5 | 8 | 0.16 | 32 |
36.5 ~ 45.5 | 2 | 0.04 | 41 |
45.5 ~ 54.5 | 1 | 0.02 | 50 |
합계 | 50 | 1.00 |
- 따라서 각 계급의 자료값을 계급값으로 대치하여 다음과 같이 평균을 구한다.
$\displaystyle \overline{x} = \frac{1}{5}(14 + \cdots + 14 + 23 + \cdots + 23 + 32 + \cdots + 32 + 41 + 41 + 50)$
$\displaystyle = \frac{1}{50}(14 × 10 + 23 × 29 + 32 × 8 + 41 × 2 + 50 × 1)$
$\displaystyle = \frac{1195}{50} = 23.9$
- 다시 말해, 도수 분포표에 의한 자료의 평균은 다음과 같이 각 계급의 도수(`f_{i}`)와 계급값(`x_{i}`)의 곱의 합을 전체 도수(`n`)로 나눈 값이다.
$$\overline{x} = \frac{1}{n} \sum_{i=1}^{k} x_{i}f_{i}$$
- 또는 평균을 구하는 식을 다음과 같이 변형할 수 있다.
$\displaystyle \overline{x} = 14 × \frac{10}{50} + 23 × \frac{29}{50} + 32 × \frac{8}{50} + 41 × \frac{2}{50} + 50 × \frac{1}{50} = \frac{1195}{50} = 23.9$
- 이 때 $\displaystyle \frac{f_{i}}{n}$ 는 `i` 번째 계급의 상대 도수이므로, 도수 분포표에 의한 평균은 각 계급의 도수와 상대도수의 곱들의 합인 것을 알 수 있다.
$$\overline{x} = \frac{1}{n} \sum_{i=1}^{k} x_{i}f_{i} = \sum_{i=1}^{n}(\frac{f_{i}}{n})x_{i}$$
- 그러면 정확한 평균 23.36과 도수 분포표에 의한 평균 23.9가 큰 차이가 없음을 알 수 있다.
예제 : 다음 도수 분포표에 의한 자료의 평균을 구하라.
계급 간격 | 도수 |
11.5 ~ 21.5 | 6 |
21.5 ~ 31.5 | 15 |
31.5 ~ 41.5 | 20 |
41.5 ~ 51.5 | 8 |
51.5 ~ 61.5 | 1 |
합계 | 50 |
각 계급의 계급값을 구하면 16.5, 26.5, 36.5, 46.5, 56.5이고, 해당하는 계급의 도수가 각각 6, 15, 29, 8, 1 이므로 도수 분포표에 대한 평균은 다음과 같다.
$\displaystyle \overline{x} = \frac{1}{50}(16.5 × 6 + 26.5 × 15 + 36.5 × 29 + 46.5 × 8 + 56.5 × 1) = \frac{1655}{50} = 33.1$
도수 분포표에서의 분산과 표준 편차
- 도수 분포표에 의한 분산은 다음과 같은 순서로 구한다.
① 도수 분포표에 의한 평균 $\overline{x}$ 를 구한다.
② 각 계급의 계급값과 평균의 편차 $x_{i} - \overline{x}$ 를 구한다.
③ ②에서 구한 편차의 제곱 $(x_{i} - \overline{x})^{2}$ 을 구한다.
④ 편차의 제곱과 도수의 곱 $(x_{i} - \overline{x})^{2}f_{i}$ 를 구한다.
⑤ $(x_{i} - \overline{x})^{2}f_{i}$ 의 합 `A` 를 구한다.
⑥ `A` 를 `n - 1` 로 나눈다.
예
10 | 37 | 22 | 32 | 18 | 15 | 15 | 18 | 22 | 15 |
20 | 25 | 38 | 28 | 25 | 30 | 20 | 22 | 18 | 22 |
22 | 12 | 22 | 26 | 22 | 32 | 22 | 23 | 20 | 23 |
23 | 20 | 25 | 51 | 20 | 25 | 26 | 22 | 26 | 28 |
28 | 20 | 23 | 30 | 12 | 22 | 35 | 11 | 20 | 25 |
계급 간격 | 도수(`f_{i}`) | 계급값(`x_{i}`) | $x_{i} - \overline{x}$ | $(x_{i} - \overline{x})^{2}$ | $(x_{i} - \overline{x})^{2}f_{i}$ |
9.5 ~ 18.5 | 10 | 14 | -9.9 | 98.01 | 980.10 |
18.5 ~ 27.5 | 29 | 23 | -0.9 | 0.81 | 23.49 |
27.5 ~ 36.5 | 8 | 32 | 8.1 | 65.61 | 524.88 |
36.5 ~ 45.5 | 2 | 41 | 17.1 | 292.41 | 584.82 |
45.5 ~ 54.5 | 1 | 50 | 26.1 | 681.21 | 681.21 |
합계 | 50 | 2794.5 |
- 구하고자 하는 분산과 표준 편차는 다음과 같다.
$\displaystyle s^{2} = \frac{1}{49} \sum_{i=1}^{5}(x_{i} - \overline{x})^{2}f_{i} = \frac{2794.5}{49} ≒ 57.03, \quad s = \sqrt{57.03} ≒ 7.552$
- 따라서 각 계급값이 각각 $x_{1}, x_{2}, \cdots, x_{k}$ 이고, 계급의 도수가 각각 $f_{1}, f_{2}, \cdots, f_{k}$ 인 도수 분포표에 의한 자료의 분산과 표준 편차는 각각 다음과 같이 구한다.
$$\displaystyle s^{2} = \frac{1}{n-1} \sum_{i=1}^{k}(x_{i} - \overline{x})^{2}f_{i}, \quad s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{k}(x_{i} - \overline{x})^{2}f_{i}}$$
'Mathematics > 확률과 통계' 카테고리의 다른 글
[확률과 통계] 베이즈 정리 (0) | 2022.10.31 |
---|---|
[확률과 통계] 조건부 확률 (0) | 2022.10.31 |
[확률과 통계] 확률 (0) | 2022.10.31 |
[확률과 통계] 시행과 사건 (0) | 2022.10.31 |
[확률과 통계] 위치 척도와 상자 그림 (0) | 2022.10.11 |
[확률과 통계] 산포도 (1) | 2022.10.10 |
[확률과 통계] 대푯값 (0) | 2022.10.10 |
[확률과 통계] 양적 자료의 정리 (0) | 2022.10.04 |