728x90
728x90

도수 분포표에서의 평균과 분산

  • 도수 분포표로 주어진 자료는 각 계급 안의 도수는 알지만 정확한 자료값을 알지 못한다. 이런 경우에는 각 계급의 계급값을 이용하여 대푯값으로 생각한다.
    • 예) 계급 간격이 9.5 ~ 18.5인 계급의 도수가 10이면, 이 계급 안의 정확한 자료값을 알 수 없으므로 10개의 자료값을 계급값 14로 생각한다.

 

도수 분포표에서의 평균

  • 도수 분포표에서 주어진 자료의 평균을 구하기 위해 각 계급의 계급값을 이용한다.

 

10 37 22 32 18 15 15 18 22 15
20 25 38 28 25 30 20 22 18 22
22 12 22 26 22 32 22 23 20 23
23 20 25 51 20 25 26 22 26 28
28 20 23 30 12 22 35 11 20 25
  • 위의 자료의 평균을 구하면 $\overline{x} = 23.36$ 이다.
  • 이 자료에 대해 계급의 수가 5인 도수 분포표를 구하면 다음과 같으며, 이 도수 분포표에는 각 계급 안에 들어있는 자료의 수는 알 수 있지만, 정확한 자료값은 알 수 없다.
계급 간격 도수(`f_{i}`) 상대 도수 계급값(`x_{i}`)
9.5 ~ 18.5 10 0.20 14
18.5 ~ 27.5 29 0.58 23
27.5 ~ 36.5 8 0.16 32
36.5 ~ 45.5 2 0.04 41
45.5 ~ 54.5 1 0.02 50
합계 50 1.00  
  • 따라서 각 계급의 자료값을 계급값으로 대치하여 다음과 같이 평균을 구한다.

$\displaystyle \overline{x} = \frac{1}{5}(14 + \cdots + 14 + 23 + \cdots + 23 + 32 + \cdots + 32 + 41 + 41 + 50)$

$\displaystyle = \frac{1}{50}(14 × 10 + 23 × 29 + 32 × 8 + 41 × 2 + 50 × 1)$

$\displaystyle = \frac{1195}{50} = 23.9$

 

  • 다시 말해, 도수 분포표에 의한 자료의 평균은 다음과 같이 각 계급의 도수(`f_{i}`)계급값(`x_{i}`)의 곱의 합을 전체 도수(`n`)로 나눈 값이다.
$$\overline{x} = \frac{1}{n} \sum_{i=1}^{k} x_{i}f_{i}$$
  • 또는 평균을 구하는 식을 다음과 같이 변형할 수 있다.

$\displaystyle \overline{x} = 14 × \frac{10}{50} + 23 × \frac{29}{50} + 32 × \frac{8}{50} + 41 × \frac{2}{50} + 50 × \frac{1}{50} = \frac{1195}{50} = 23.9$

 

  • 이 때 $\displaystyle \frac{f_{i}}{n}$ 는 `i` 번째 계급의 상대 도수이므로, 도수 분포표에 의한 평균은 각 계급의 도수와 상대도수의 곱들의 합인 것을 알 수 있다.
$$\overline{x} = \frac{1}{n} \sum_{i=1}^{k} x_{i}f_{i} = \sum_{i=1}^{n}(\frac{f_{i}}{n})x_{i}$$

 

  • 그러면 정확한 평균 23.36과 도수 분포표에 의한 평균 23.9큰 차이가 없음을 알 수 있다.

 

예제 : 다음 도수 분포표에 의한 자료의 평균을 구하라.
계급 간격 도수
11.5 ~ 21.5 6
21.5 ~ 31.5 15
31.5 ~ 41.5 20
41.5 ~ 51.5 8
51.5 ~ 61.5 1
합계 50
더보기

각 계급의 계급값을 구하면 16.5, 26.5, 36.5, 46.5, 56.5이고, 해당하는 계급의 도수가 각각 6, 15, 29, 8, 1 이므로 도수 분포표에 대한 평균은 다음과 같다.

 

$\displaystyle \overline{x} = \frac{1}{50}(16.5 × 6 + 26.5 × 15 + 36.5 × 29 + 46.5 × 8 + 56.5 × 1) = \frac{1655}{50} = 33.1$

 

도수 분포표에서의 분산과 표준 편차

  • 도수 분포표에 의한 분산은 다음과 같은 순서로 구한다.
① 도수 분포표에 의한 평균 $\overline{x}$ 를 구한다.
② 각 계급의 계급값평균의 편차 $x_{i} - \overline{x}$ 를 구한다.
③ ②에서 구한 편차의 제곱 $(x_{i} - \overline{x})^{2}$ 을 구한다.
④ 편차의 제곱과 도수의 곱 $(x_{i} - \overline{x})^{2}f_{i}$ 를 구한다.
⑤ $(x_{i} - \overline{x})^{2}f_{i}$ 의 합 `A` 를 구한다.
⑥ `A` 를 `n - 1` 로 나눈다.

 

예 
10 37 22 32 18 15 15 18 22 15
20 25 38 28 25 30 20 22 18 22
22 12 22 26 22 32 22 23 20 23
23 20 25 51 20 25 26 22 26 28
28 20 23 30 12 22 35 11 20 25
계급 간격 도수(`f_{i}`) 계급값(`x_{i}`) $x_{i} - \overline{x}$ $(x_{i} - \overline{x})^{2}$ $(x_{i} - \overline{x})^{2}f_{i}$
9.5 ~ 18.5 10 14 -9.9 98.01 980.10
18.5 ~ 27.5 29 23 -0.9 0.81 23.49
27.5 ~ 36.5 8 32 8.1 65.61 524.88
36.5 ~ 45.5 2 41 17.1 292.41 584.82
45.5 ~ 54.5 1 50 26.1 681.21 681.21
합계 50       2794.5
  • 구하고자 하는 분산표준 편차는 다음과 같다.

$\displaystyle s^{2} = \frac{1}{49} \sum_{i=1}^{5}(x_{i} - \overline{x})^{2}f_{i} = \frac{2794.5}{49} ≒ 57.03, \quad s = \sqrt{57.03} ≒ 7.552$

  • 따라서 각 계급값이 각각 $x_{1}, x_{2}, \cdots, x_{k}$ 이고, 계급의 도수가 각각 $f_{1}, f_{2}, \cdots, f_{k}$ 인 도수 분포표에 의한 자료의 분산표준 편차는 각각 다음과 같이 구한다.
$$\displaystyle s^{2} = \frac{1}{n-1} \sum_{i=1}^{k}(x_{i} - \overline{x})^{2}f_{i}, \quad s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{k}(x_{i} - \overline{x})^{2}f_{i}}$$
728x90
728x90