728x90
728x90

확률 변수의 평균과 분산

  • 양적 자료에 대한 평균도수 히스토그램의 중심 위치를 나타내고, 분산평균을 중심으로 흩어진 정도를 나타낸다.
  • 이와 마찬가지로 확률 변수 XX 의 분포에 대한 중심 위치인 평균과 이 값을 중심으로 흩어진 정도인 분산을 정의할 수 있다.

 

확률 변수의 평균

  • 어느 마트에서 창립 기념으로 고객에게 상품권을 제공하는 시은행사를 실시한다.
  • 이 마트에서 제작한 복권의 수와 상품권 금액은 다음과 같다.
상품권 복권 수
100만원 2
50만원 8
10만원 10
0원 30
  • 이 마트에서 고객에게 제공하는 상금의 평균¯x¯¯¯x 라 하면 다음과 같이 구할 수 있다.
¯x=150(0×30+10×10+50×8+100×2)=0×3050+10×1050+50×850+100×25=14¯¯¯x=150(0×30+10×10+50×8+100×2)=0×3050+10×1050+50×850+100×25=14
  • 이 때, 상품권의 금액을 확률 변수 XX 라 하면 이 확률 변수는 이산 확률 변수이다.
  • 그리고 XX 가 취할 수 있는 값은 0원, 10만원, 50만원, 100만원이고, 각 상금에 대한 확률을 나타내면 다음과 같다.
XX 0 10 50 100
f(x)f(x) 3535 1515 425425 125125
  • 그러면 이산 확률 변수 XX평균확률 변수가 취하는 값과 그에 대응하는 확률의 곱을 모두 더한 것과 동일한 것을 알 수 있다.
  • 그리고 확률 변수 XX평균은 다음과 같이 확률 히스토그램의 중심 위치를 나타낸다.

확률 변수의 평균과 의미

  • 이와 같이 이산 확률 변수 XX확률 분포가 아래와 같을 때, XX 의 평균은 다음과 같다.
¯x=x1p1+x2p2+x3p3++xnpn=ni=1xipi¯¯¯x=x1p1+x2p2+x3p3++xnpn=ni=1xipi
XX x1x1 x2x2 x3x3 xnxn 합계
f(x)f(x) p1p1 p2p2 p3p3 pnpn 11
  • 즉, 이산 확률 변수 XX평균은 이 확률 변수가 취할 수 있는 모든 값과 그에 대응하는 확률의 곱을 더하여 얻는다.
  • 이와 마찬가지로 연속 확률 변수 XX 평균확률 변수가 취할 수 있는 모든 값과 그에 대응하는 확률 밀도 함수의 곱을 적분하여 얻는다.
  • 이 때, 확률 변수의 평균기댓값이라 한다.

 

기댓값(Expected Value)

확률 변수 XX 에 대해 다음과 같이 정의되는 수치 μ=E(X)μ=E(X)XX기댓값(Expected Value) 또는 평균(Mean)이라 한다.
μ=E(X)={(xSX)xf(x),X가 이산 확률 변수인 경우xf(x)dx,X가 연속 확률 변수인 경우μ=E(X)=(xSX)xf(x),X xf(x)dx,X

 

예제 : 주사위를 두 번 반복하여 던지는 시행에서 두 눈의 차의 절댓값을 확률 변수 XX 라 할 때, XX 의 기댓값 E(X)E(X) 를 구하라.
해설 보기

확률 변수 XX확률 분포를 나타내면 다음과 같다.

XX 0 1 2 3 4 5 합계
P(X=x)P(X=x) 636636 10361036 836836 636636 436436 236236 1

따라서 XX 의 기댓값을 구하면 다음과 같다.

E(X)=0×636+1×1036+2×836+3×636+4×436+5×236=35181.944E(X)=0×636+1×1036+2×836+3×636+4×436+5×236=35181.944

 

기댓값의 성질

  • 이산 확률 변수 XX 의 확률 질량 함수를 f(x)f(x) 라 하면, Y=aX+b,a0Y=aX+b,a0 의 기댓값은 다음과 같다.
E(aX+b)=xSx(ax+b)f(x)=xSX[axf(x)+bf(x)]=axSXxf(x)+bxSXf(x)=aE(X)+bE(aX+b)=xSx(ax+b)f(x)=xSX[axf(x)+bf(x)]=axSXxf(x)+bxSXf(x)=aE(X)+b
  • 따라서 확률 변수 XX 에 대해 다음과 같은 기댓값의 성질을 얻는다. (단, a,ba,b 는 상수이다.)
E(a)=aE(a)=a
E(aX)=aE(X)E(aX)=aE(X)
E(aX+b)=aE(X)+bE(aX+b)=aE(X)+b

 

확률 변수 XX 의  함수인 Y=g(x)Y=g(x) 의 기댓값

  • 확률 변수 XX 의 함수인 Y=g(x)Y=g(x) 의 기댓값은 다음과 같다.
E(g(X))={(xSX)g(x)f(x),X가 이산 확률 변수인 경우g(x)f(x)dx,X가 연속 확률 변수인 경우E(g(X))=(xSX)g(x)f(x),X g(x)f(x)dx,X

 

예제 : 연속 확률 변수 XX 의 확률 밀도 함수가 f(x)=38x2,0x2f(x)=38x2,0x2 일 때, 다음을 구하라.

(a) XX 의 기댓값

(b) 2X+12X+1 의 기댓값

(c) X2X2 의 기댓값

해설 보기

(a)

E(X)=xf(x)dx=3820x3dx=[332x4]20=32E(X)=xf(x)dx=3820x3dx=[332x4]20=32

 

(b)

E(2X+1)=2E(X)+1=2×32+1=4E(2X+1)=2E(X)+1=2×32+1=4

 

(c)

E(X2)=x2f(x)dx=3820x4dx=[340x5]20=125E(X2)=x2f(x)dx=3820x4dx=[340x5]20=125

 

확률 변수의 분산

  • 아래 그림의 두 확률 분포는 중심 위치인 평균은 동일하지만, 평균을 중심으로 밀집하는 정도가 다르다.
  • 따라서 확률 분포의 특징을 결정짓는 중요한 척도로, 밀집 정도를 나타내는 산포의 척도인 분산을 생각할 수 있다.

분산에 따른 확률 분포

 

확률 변수의 분산(Variance)과 표준 편차(Standard Deviation)

① 분산(Variance) : 확률 변수 XX 의 평균 μ=E(X)μ=E(X) 에 대해 평균 편차의 제곱 (Xμ)2(Xμ)2 에 대한 평균 E[(Xμ)2],σ2E[(Xμ)2],σ2 또는 Var(X)Var(X) 로 나타낸다.
② 표준 편차(Standard Deviation) : 분산의 양의 제곱근 Var(X)Var(X)
  • 예를 들어, 다음과 같이 주어진 이산 확률 변수 XX 의 평균을 μ=E(X)μ=E(X) 라 하자.
XX x1x1 x2x2 x3x3 xnxn
(Xμ)2(Xμ)2 (x1μ)2(x1μ)2 (x2μ)2(x2μ)2 (x3μ)2(x3μ)2 (xnμ)2(xnμ)2
f(x)f(x) p1p1 p2p2 p3p3 pnpn
  • 그러면 XX 의 분산은 확률 변수 XX 와 평균 μμ 의 편차 제곱 (Xμ)2(Xμ)2 의 평균이므로 다음을 얻는다.
Var(X)=E[(Xμ)2]=ni=1(xiμ)2pi=ni=1(x2ipi2μxipi+μ2pi)=ni=1x2ipi2μni=1xipi+μ2ni=1piVar(X)=E[(Xμ)2]=ni=1(xiμ)2pi=ni=1(x2ipi2μxipi+μ2pi)=ni=1x2ipi2μni=1xipi+μ2ni=1pi
  • 이 떄, μμ 는 이산 확률 변수 XX 의 평균이고, pi,i=1,2,,npi,i=1,2,,nXX 가 취할 수 있는 각 경우의 확률이므로 다음을 얻는다.
E(X2)=ni=1x2ipi,μ=ni=1xipi,ni=1pi=1E(X2)=ni=1x2ipi,μ=ni=1xipi,ni=1pi=1
  • 따라서 이산 확률 변수 XX 의 분산은 Var(X)=E(X2)μ2Var(X)=E(X2)μ2 이다.
  • 이는 연속 확률 변수에 대해서도 동일하게 적용된다.
  • 그러므로 다음과 같이 분산을 쉽게 구할 수 있다.
Var(X)=E(X2)μ2=E(X2)(E(X))2Var(X)=E(X2)μ2=E(X2)(E(X))2

 

분산의 성질

  • 기댓값의 성질분산의 정의로부터 다음의 성질을 쉽게 얻을 수 있다.
Var(a)=0Var(a)=0
Var(aX)=a2Var(X)Var(aX)=a2Var(X)
Var(aX+b)=a2Var(X)Var(aX+b)=a2Var(X)

 

표준화 확률 변수(Standardized Random Variable)

  • 확률 변수 XX 의 평균 μμ 와 표준 편차 σσ 에 대해 확률 변수 Z=XμσZ=XμσXX표준화 확률 변수(Standardized Random Variable)라 한다.
  • 그러면 표준화 확률 변수평균분산은 각각 다음과 같다.
E(Z)=1σXμσ=1σE(X)μσ=0Var(Z)=Var(1σXμσ)=1σ2Var(X)=1

 

예제 : 연속 확률 변수 X 의 확률 밀도 함수가 f(x)=38x2,0x2 일 때, 확률 변수 X 의 분산과 표준 편차를 구하라.
해설 보기

(1) μ(E(X)) 구하기

μ=E(X)=xf(x)dx=3820x3dx=[332x4]20=32

 

(2) μ(E(X2)) 구하기

E(X2)=x2f(x)dx=3820x4dx=[340x5]20=125

 

따라서 확률 변수 X 의 분산 σ2 과 표준 편차 σ 를 구하면 각각 다음과 같다.

σ2=E(X2)μ2=125(32)2=320,σ=3200.3878

728x90
728x90

확률 변수의 평균과 분산확률 변수의 평균기댓값(Expected Value)기댓값의 성질확률 변수 X 의  함수인 Y=g(x) 의 기댓값확률 변수의 분산확률 변수의 분산(Variance)과 표준 편차(Standard Deviation)분산의 성질표준화 확률 변수(Standardized Random Variable)