확률 변수의 평균과 분산
- 양적 자료에 대한 평균은 도수 히스토그램의 중심 위치를 나타내고, 분산은 평균을 중심으로 흩어진 정도를 나타낸다.
- 이와 마찬가지로 확률 변수 XX 의 분포에 대한 중심 위치인 평균과 이 값을 중심으로 흩어진 정도인 분산을 정의할 수 있다.
확률 변수의 평균
- 어느 마트에서 창립 기념으로 고객에게 상품권을 제공하는 시은행사를 실시한다.
- 이 마트에서 제작한 복권의 수와 상품권 금액은 다음과 같다.
상품권 | 복권 수 |
100만원 | 2 |
50만원 | 8 |
10만원 | 10 |
0원 | 30 |
- 이 마트에서 고객에게 제공하는 상금의 평균을 ¯x¯¯¯x 라 하면 다음과 같이 구할 수 있다.
¯x=150(0×30+10×10+50×8+100×2)=0×3050+10×1050+50×850+100×25=14¯¯¯x=150(0×30+10×10+50×8+100×2)=0×3050+10×1050+50×850+100×25=14 |
- 이 때, 상품권의 금액을 확률 변수 XX 라 하면 이 확률 변수는 이산 확률 변수이다.
- 그리고 XX 가 취할 수 있는 값은 0원, 10만원, 50만원, 100만원이고, 각 상금에 대한 확률을 나타내면 다음과 같다.
XX | 0 | 10 | 50 | 100 |
f(x)f(x) | 3535 | 1515 | 425425 | 125125 |
- 그러면 이산 확률 변수 XX 의 평균은 확률 변수가 취하는 값과 그에 대응하는 확률의 곱을 모두 더한 것과 동일한 것을 알 수 있다.
- 그리고 확률 변수 XX 의 평균은 다음과 같이 확률 히스토그램의 중심 위치를 나타낸다.

- 이와 같이 이산 확률 변수 XX 의 확률 분포가 아래와 같을 때, XX 의 평균은 다음과 같다.
¯x=x1p1+x2p2+x3p3+⋯+xnpn=n∑i=1xipi¯¯¯x=x1p1+x2p2+x3p3+⋯+xnpn=n∑i=1xipi
XX | x1x1 | x2x2 | x3x3 | ⋯⋯ | xnxn | 합계 |
f(x)f(x) | p1p1 | p2p2 | p3p3 | ⋯⋯ | pnpn | 11 |
- 즉, 이산 확률 변수 XX 의 평균은 이 확률 변수가 취할 수 있는 모든 값과 그에 대응하는 확률의 곱을 더하여 얻는다.
- 이와 마찬가지로 연속 확률 변수 XX 의 평균은 확률 변수가 취할 수 있는 모든 값과 그에 대응하는 확률 밀도 함수의 곱을 적분하여 얻는다.
- 이 때, 확률 변수의 평균을 기댓값이라 한다.
기댓값(Expected Value)
확률 변수 XX 에 대해 다음과 같이 정의되는 수치 μ=E(X)μ=E(X) 를 XX 의 기댓값(Expected Value) 또는 평균(Mean)이라 한다.
μ=E(X)={∑모든(x∈SX)xf(x),X가 이산 확률 변수인 경우∫∞−∞xf(x)dx,X가 연속 확률 변수인 경우μ=E(X)=⎧⎨⎩∑모든(x∈SX)xf(x),X가 이산 확률 변수인 경우∫∞−∞xf(x)dx,X가 연속 확률 변수인 경우
예제 : 주사위를 두 번 반복하여 던지는 시행에서 두 눈의 차의 절댓값을 확률 변수 XX 라 할 때, XX 의 기댓값 E(X)E(X) 를 구하라.
확률 변수 XX 의 확률 분포를 나타내면 다음과 같다.
XX | 0 | 1 | 2 | 3 | 4 | 5 | 합계 |
P(X=x)P(X=x) | 636636 | 10361036 | 836836 | 636636 | 436436 | 236236 | 1 |
따라서 XX 의 기댓값을 구하면 다음과 같다.
E(X)=0×636+1×1036+2×836+3×636+4×436+5×236=3518≒1.944E(X)=0×636+1×1036+2×836+3×636+4×436+5×236=3518≒1.944
기댓값의 성질
- 이산 확률 변수 XX 의 확률 질량 함수를 f(x)f(x) 라 하면, Y=aX+b,a≠0Y=aX+b,a≠0 의 기댓값은 다음과 같다.
E(aX+b)=∑x∈Sx(ax+b)f(x)=∑x∈SX[axf(x)+bf(x)]=a∑x∈SXxf(x)+b∑x∈SXf(x)=aE(X)+bE(aX+b)=∑x∈Sx(ax+b)f(x)=∑x∈SX[axf(x)+bf(x)]=a∑x∈SXxf(x)+b∑x∈SXf(x)=aE(X)+b
- 따라서 확률 변수 XX 에 대해 다음과 같은 기댓값의 성질을 얻는다. (단, a,ba,b 는 상수이다.)
① E(a)=aE(a)=a
② E(aX)=aE(X)E(aX)=aE(X)
③ E(aX+b)=aE(X)+bE(aX+b)=aE(X)+b
확률 변수 XX 의 함수인 Y=g(x)Y=g(x) 의 기댓값
- 확률 변수 XX 의 함수인 Y=g(x)Y=g(x) 의 기댓값은 다음과 같다.
E(g(X))={∑모든(x∈SX)g(x)f(x),X가 이산 확률 변수인 경우∫∞−∞g(x)f(x)dx,X가 연속 확률 변수인 경우E(g(X))=⎧⎨⎩∑모든(x∈SX)g(x)f(x),X가 이산 확률 변수인 경우∫∞−∞g(x)f(x)dx,X가 연속 확률 변수인 경우
예제 : 연속 확률 변수 XX 의 확률 밀도 함수가 f(x)=38x2,0≤x≤2f(x)=38x2,0≤x≤2 일 때, 다음을 구하라.
(a) XX 의 기댓값
(b) 2X+12X+1 의 기댓값
(c) X2X2 의 기댓값
(a)
E(X)=∫∞−∞xf(x)dx=38∫20x3dx=[332x4]20=32E(X)=∫∞−∞xf(x)dx=38∫20x3dx=[332x4]20=32
(b)
E(2X+1)=2E(X)+1=2×32+1=4E(2X+1)=2E(X)+1=2×32+1=4
(c)
E(X2)=∫∞−∞x2f(x)dx=38∫20x4dx=[340x5]20=125E(X2)=∫∞−∞x2f(x)dx=38∫20x4dx=[340x5]20=125
확률 변수의 분산
- 아래 그림의 두 확률 분포는 중심 위치인 평균은 동일하지만, 평균을 중심으로 밀집하는 정도가 다르다.
- 따라서 확률 분포의 특징을 결정짓는 중요한 척도로, 밀집 정도를 나타내는 산포의 척도인 분산을 생각할 수 있다.

확률 변수의 분산(Variance)과 표준 편차(Standard Deviation)
① 분산(Variance) : 확률 변수 XX 의 평균 μ=E(X)μ=E(X) 에 대해 평균 편차의 제곱 (X−μ)2(X−μ)2 에 대한 평균 E[(X−μ)2],σ2E[(X−μ)2],σ2 또는 Var(X)Var(X) 로 나타낸다.
② 표준 편차(Standard Deviation) : 분산의 양의 제곱근 √Var(X)√Var(X)
- 예를 들어, 다음과 같이 주어진 이산 확률 변수 XX 의 평균을 μ=E(X)μ=E(X) 라 하자.
XX | x1x1 | x2x2 | x3x3 | ⋯⋯ | xnxn |
(X−μ)2(X−μ)2 | (x1−μ)2(x1−μ)2 | (x2−μ)2(x2−μ)2 | (x3−μ)2(x3−μ)2 | ⋯⋯ | (xn−μ)2(xn−μ)2 |
f(x)f(x) | p1p1 | p2p2 | p3p3 | ⋯⋯ | pnpn |
- 그러면 XX 의 분산은 확률 변수 XX 와 평균 μμ 의 편차 제곱 (X−μ)2(X−μ)2 의 평균이므로 다음을 얻는다.
Var(X)=E[(X−μ)2]=n∑i=1(xi−μ)2pi=n∑i=1(x2ipi−2μxipi+μ2pi)=n∑i=1x2ipi−2μn∑i=1xipi+μ2n∑i=1piVar(X)=E[(X−μ)2]=n∑i=1(xi−μ)2pi=n∑i=1(x2ipi−2μxipi+μ2pi)=n∑i=1x2ipi−2μn∑i=1xipi+μ2n∑i=1pi
- 이 떄, μμ 는 이산 확률 변수 XX 의 평균이고, pi,i=1,2,⋯,npi,i=1,2,⋯,n 는 XX 가 취할 수 있는 각 경우의 확률이므로 다음을 얻는다.
E(X2)=n∑i=1x2ipi,μ=n∑i=1xipi,n∑i=1pi=1E(X2)=n∑i=1x2ipi,μ=n∑i=1xipi,n∑i=1pi=1
- 따라서 이산 확률 변수 XX 의 분산은 Var(X)=E(X2)−μ2Var(X)=E(X2)−μ2 이다.
- 이는 연속 확률 변수에 대해서도 동일하게 적용된다.
- 그러므로 다음과 같이 분산을 쉽게 구할 수 있다.
Var(X)=E(X2)−μ2=E(X2)−(E(X))2Var(X)=E(X2)−μ2=E(X2)−(E(X))2
분산의 성질
- 기댓값의 성질과 분산의 정의로부터 다음의 성질을 쉽게 얻을 수 있다.
① Var(a)=0Var(a)=0
② Var(aX)=a2Var(X)Var(aX)=a2Var(X)
③ Var(aX+b)=a2Var(X)Var(aX+b)=a2Var(X)
표준화 확률 변수(Standardized Random Variable)
- 확률 변수 XX 의 평균 μμ 와 표준 편차 σσ 에 대해 확률 변수 Z=X−μσZ=X−μσ 를 XX 의 표준화 확률 변수(Standardized Random Variable)라 한다.
- 그러면 표준화 확률 변수의 평균과 분산은 각각 다음과 같다.
E(Z)=1σX−μσ=1σE(X)−μσ=0Var(Z)=Var(1σX−μσ)=1σ2Var(X)=1
예제 : 연속 확률 변수 X 의 확률 밀도 함수가 f(x)=38x2,0≤x≤2 일 때, 확률 변수 X 의 분산과 표준 편차를 구하라.
(1) μ(E(X)) 구하기
μ=E(X)=∫∞−∞xf(x)dx=38∫20x3dx=[332x4]20=32
(2) μ(E(X2)) 구하기
E(X2)=∫∞−∞x2f(x)dx=38∫20x4dx=[340x5]20=125
따라서 확률 변수 X 의 분산 σ2 과 표준 편차 σ 를 구하면 각각 다음과 같다.
σ2=E(X2)−μ2=125−(32)2=320,σ=√320≒0.3878
'Mathematics > 확률과 통계' 카테고리의 다른 글
[확률과 통계] 모평균의 추정 (0) | 2022.11.27 |
---|---|
[확률과 통계] 모집단과 표본 (0) | 2022.11.21 |
[확률과 통계] 연속 확률 분포 (0) | 2022.11.21 |
[확률과 통계] 이산 확률 분포 (0) | 2022.11.14 |
[확률과 통계] 연속 확률 변수 (0) | 2022.11.14 |
[확률과 통계] 이산 확률 변수 (0) | 2022.11.07 |
[확률과 통계] 베이즈 정리 (0) | 2022.10.31 |
[확률과 통계] 조건부 확률 (0) | 2022.10.31 |