728x90
728x90

자료의 종류

  • 통계적인 목적에 맞춰서 수집된 대상을 자료(Data)라고 한다.
  • 이러한 자료를 수집하여 분석하거나, 이를 표 또는 그림으로 표현하여 수집한 자료로부터 의미 있는 정보를 얻어내는 일련의 과정을 통계(Statistics)라고 한다. 

 

자료의 종류

  • 자료(Data)숫자에 의해 표현되는지 그렇지 않은지에 따라 크게 2가지로 분류된다.

 

양적 자료(Qualitative Data)와 질적 자료(Quantitative Data)

  • 혈액형은 A형, B형, AB형, O형이라는 범주로 구분될 뿐 숫자에 의해 표현할 수 없다.
  • 키 또는 몸무게에 대한 자료는 범주가 아닌 숫자로 표현되며, 숫자에 대해 대소 관계 또는 크기 관계가 구분된다.
  • 이와 같이 범주로 표현되는 자료를 질적 자료라 하고, 숫자에 의해 표현되는 자료를 양적 자료라고 한다.
- 질적 자료(Qualitative Data) : 숫자에 의해 표현되지 않는 자료
- 양적 자료(Quantitative Data) : 숫자에 의해 표현되고, 그 숫자에 의미가 부여되는 자료

 

  • 한편, 숫자로 표현되는 양적 자료에는 하루 동안 핸드폰에 수신된 스팸 문자의 횟수와 같이 셈을 할 수 있는 자료와 키 또는 몸무게와 같이 어떤 구간 안에서 측정되는 자료로 구분된다.
  • 이 때, 셈을 할 수 있는 양적 자료를 이산 자료라 하고, 어떤 구간으로 측정되는 양적 자료를 연속 자료라고 한다.

 

이산 자료(Discrete Data)와 연속 자료(Continuous Data)

- 이산 자료(Discrete Data) : 셈을 할 수 있는 자료
- 연속 자료(Continuous Data) : 어떤 구간 안에서 측정되는 자료

 

자료의 종류

 

  • 숫자에 의해 표현되지 않는 질적 자료는 각 범주를 숫자로 나타낸 자료인 명목 자료와 순서의 개념을 갖는 순서 자료로 구분된다.

 

명목 자료(Nominal Data)와 순서 자료(Ordinal Data)

  • 고객 만족도 조사에서는 5점 척도인 다음과 같은 문항을 많이 사용한다.
    • [① 매우 만족    ② 만족    ③ 보통    ④ 불만족    ⑤ 매우 불만족]
  • 이 때, 숫자 1, 2, 3, 4, 5 는 다섯 가지 범주를 나타낼 뿐이지 숫자로서의 의미는 없다. 
  • 이와 같이 각 범주를 숫자로 나타낸 자료를 명목 자료(Nominal Data)라 한다.

 

  • 그러나 다음과 같이 초등학교부터 대학교까지 네 가지 범주에 숫자 1, 2, 3, 4를 부여한다고 하자.
    • [① 초등학교    ② 중학교    ③ 고등학교    ④ 대학교]
  • 그러면 명목 자료 1, 2, 3, 4 에는 "초등학교 → 중학교 → 고등학교 → 대학교' 라는 순서의 개념이 포함된다.
  • 이와 같이 순서의 개념을 갖는 질적 자료를 순서 자료(Ordinal Data)라 한다.
- 명목 자료(Nominal Data) : 각 범주를 숫자로 나타낸 자료
- 순서 자료(Ordinal Data) : 순서의 개념을 갖는 질적 자료

 

집단화 자료(Grouped Data)

  • 양적 자료인 통계학 성적을 90점 이상 A, 80 ~ 89점 B, 70 ~ 79점 C, 60 ~ 69점 D, 59점 이하는 F 라는 범주로 묶어서 나타낼 수 있다.
  • 이와 같이 양적 자료를 구간별로 구분한 자료를 집단화 자료(Grouped Data)라 한다.
집단화 자료(Grouped Data) : 양적 자료를 구간별로 구분한 자료

 

자료의 형태

 

모집단(Population)과 표본(Sample)

  • 선거철이면 각종 여론 조사 기관에서 유권자의 일부를 대상으로 지지도를 조사한다. 그리고 선거 당일에는 모든 유권자의 투표 결과를 얻는다.
    • 모든 유권자를 대상으로 얻은 자료 집단을 모집단이라고 한다.
    • 일부 유권자를 대상으로 얻은 자료 집단을 표본이라고 한다.
  • 표본을 선택하는 경우에는 공정한 결과를 얻기 위해 모집단을 이루는 개개의 자료들이 선정될 가능성을 동등하게 부여해야 한다.
- 모집단(Population) : 통계 목적에 부합하는 모든 자료들의 집단
- 표본(Sample) : 모집단의 일부인 자료들의 집단

 

  • 이 때, 모집단을 구성하는 자료의 개수모집단 크기(Population Size)라 하고, 표본을 구성하는 자료의 개수표본 크기(Sample Size)라 한다.

모집단과 표본

 

728x90
728x90