728x90
728x90

이산 확률 변수

이산 확률 변수의 의미

  • 동전을 두 번 던지는 게임에서 앞면이 나온 횟수를 XX 로 나타내면, XX 를 이용하여 앞면이 나온 횟수라는 특성에 따라 구분된 사건을 다음과 같이 간단히 표현할 수 있다.
{HH}X=2{HT,TH}X=1{TT}X=0{HH}X=2{HT,TH}X=1{TT}X=0
  • 그러므로 앞면이 나온 횟수인 XX 는 아래와 같이 표본 공간 SS 에서 실수 전체의 집합 RR 로의 함수로 생각할 수 있다.
  • 이 때 앞면이 나온 횟수인 XX 확률 변수(Random Variable)라고 한다.

확률 변수의 의미

 

확률 변수(Random Variable)

표본 공간 SS 안의 원소에 실수를 대응시키는 함수를 확률 변수(Random Variable)라 하며, 보통 XX 와 같이 대문자로 나타낸다.
  • 표본 공간 안의 원소를 확률 변수로 나타내면, 표본 공간을 간단히 표현할 수 있다.
  • 예) 앞의 확률 변수 XX 가 취할 수 있는 모든 값은 {0,1,2}{0,1,2} 뿐이다.
  • 이 때, 확률 변수 XX 가 취할 수 있는 모든 가능한 숫자들의 집합상태 공간(State Space)이라 하고, SXSX 로 나타낸다.
  • 동전 두 번 던지기와 같은 경우에는 XX 의 상태 공간을 구성하는 숫자는 3개뿐이다. ({HH,HT,TT}{HH,HT,TT})
  • 그러나 1의 눈이 나올 때까지 주사위를 던진 횟수를 확률 변수 XX 라 하면, XX 가 취할 수 있는 모든 가능한 수는 무수히 많다.
    • 이 경우에 확률 변수 XX 의 상태 공간은 SX={1,2,3,}SX={1,2,3,} 이고, 이 상태 공간을 이루는 숫자는 무수히 많으나 그 숫자들을 셈할 수 있다.
  • 따라서 확률 변수 XX 의 상태 공간을 구성하는 숫자는 유한개이거나 무수히 많더라도 셈할 수 있으며, 이러한 확률 변수를 이산 확률 변수라 한다.

 

이산 확률 변수(Discrete Random Variable)

확률 변수 XX 에 대한 상태 공간을 구성하는 원소의 수가 유한개이거나 무수히 많더라도 셀 수 있는 경우XX이산 확률 변수(Discrete Random Variable)라 한다.

 

예제 : 주사위를 두 번 반복하여 던지는 시행에서 두 눈의 차의 절댓값을 확률 변수 XX 라 한다. 이 때, XX 의 상태 공간을 구하라.
해설 보기

주사위를 두 번 던지는 시행에서 첫 번째 나온 눈의 수를 ii, 두 번째 나온 눈의 수를 jj 라 하면 확률 변수 XX 는 다음과 같이 정의된다.

X=|ij|,i,j=1,2,3,4,5,6X=|ij|,i,j=1,2,3,4,5,6

그러므로 XX 의 상태 공간은 SX={0,1,2,3,4,5}SX={0,1,2,3,4,5} 이다.

 

예제 : 다음을 나타내는 확률 변수가 이산 확률 변수인지 아닌지 판단하라.

(a) 정류장에 도착한 버스에 승차한 승객의 수

(b) 새로 교체한 프로젝트용 전구의 수명

해설 보기

(a) 버스에 승차한 승객의 수는 셈을 할 수 있으므로 이산 확률 변수이다.

(b) 새로 교체한 프로젝트용 전구의 수명은 셈할 수 없으므로 이산 확률 변수가 아니다.

 

확률 질량 함수(Probability Mess Function)

XX 의 상태 공간 SXSX 안에 있는 각각의 xx 에 대해 f(x)=P(X=x)f(x)=P(X=x) 이고, SXSX 안에 있지 않은 모든 실수 xx 에 대해 f(x)=0f(x)=0 으로 정의한 함수 f(x)f(x), 즉 다음과 같이 정의되는 함수 f(x)f(x)이산 확률 변수 XX 확률 질량 함수(Probability Mess Function)라 한다.
f(x)={P(X=x),xSX0,xSXf(x)={P(X=x),xSX0,xSX
  • 동전을 두 번 던지는 경우에 앞면이 나온 횟수를 확률 변수 XX 라 하자.
  • 그러면 XX 의 상태 공간은 SX={0,1,2}SX={0,1,2} 이다. 그리고 앞면이 나온 횟수에 대한 사건확률 변수는 다음과 같다.
{HH}X=2,{HT,TH}X=1,{TT}X=0{HH}X=2,{HT,TH}X=1,{TT}X=0
  • 특히, 각 사건에 대한 확률은 다음과 같다.
P({HH})=14,P({HT,TH}=12,P({TT})=14
  • 따라서 다음과 같이 확률 변수 X 가 취하는 경우에 대한 확률을 정의할 수 있다.
    • 즉, 확률 변수 X 에 대한 확률은 다음과 같다.
P(X=0)=14,P(X=1)=12,P(X=2)=14

확률 변수와 확률

  • 위와 같이 표본 공간 안의 사건을 원소의 특성에 따라 확률 변수로 변환하면 확률 변수에 대한 확률을 정의할 수 있다.
  • 이 때, 확률 변수 X상태 공간 안에 있는 값 x 에 따라 확률이 변하므로 확률 변수 X 에 대한 확률을 나타내는 함수확률 질량 함수로 정의할 수 있다.

 

확률 질량 함수의 성질

  • 확률 질량 함수 f(x) 는 다음 성질을 갖는다.
(1) 임의의 실수 x 에 대해 0f(x)1 이다.
(2) 모든 xf(x)=1 이다.
  • 예를 들어, X 의 상태 공간이 SX={x1,x2,x3,,xn} 이고, pi=P(X=xi),i=1,2,3,,n 이면 다음의 확률표를 얻는다.
X x1 x2 x3 xn 합계
f(x) p1 p2 p3 pn 1

 

확률 분포(Probability Distribution)와 확률 히스토그램(Probability Histogram)

  • 확률표와 같이 확률 변수 X 가 취할 수 있는 개개의 값에 확률을 대응시킨 것을 확률 변수 X확률 분포(Probability Distribution)라 한다.
  • 이와 같은 확률 분포는 위와 같이 확률표 또는 확률 질량 함수나 아래와 같이 확률 변수 X취하는 값을 중심으로 밑변의 길이가 1이고 확률을 높이로 하는 확률 히스토그램(Probability Histogram)으로 나타낼 수 있다.

확률 히스토그램

  • 그러면 임의의 두 실수 ab 에 대해 X 가 구간 [a,b] 안에 들어갈 확률 P(aXb) 는 다음과 같이 확률 질량 함수 f(x) 를 이용하여 구할 수 있다.
P(aXb)=axbf(x)
  • 특히, 정수값을 갖는 확률 변수 X 의 상태 공간 안에 있는 어떤 수 a 에 대해 다음을 얻는다.
P(X>a)=1P(Xa)P(Xa)=1P(Xa1)

 

예제 : 주사위를 두 번 반복하여 던지는 시행에서 두 눈의 차의 절댓값을 확률 변수 X 라 할 때, 다음을 구하라.

(a) 확률 변수 X 의 확률 질량 함수

(b) 두 눈의 차의 절댓값이 3일 확률

(c) 두 눈의 차의 절댓값이 2 이상 4 이하일 확률

(d) 두 눈의 차의 절댓값이 4 이상일 확률

해설 보기

(a) 

확률 변수 X 가 취하는 각각의 수에 대한 사건을 나타내면 다음과 같다.

X=0{(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}
X=1{(1,2),(2,1),(2,3),(3,2),(3,4),(4,3),(4,5),(5,4),(5,6),(6,5)}
X=2{(1,3),(3,1),(2,4),(4,2),(3,5),(5,3),(4,6),(6,4)}
X=3{(1,4),(4,1),(2,5),(5,3),(3,6),(6,3)}
X=4{(1,5),(5,1),(2,6),(6,2)}
X=5{(1,6),(6,1)}

따라서 확률 변수 X 가 취하는 각각의 수에 대한 확률을 구하면 다음과 같다.

P(X=0)=636,P(X=1)=1036,P(X=2)=836,P(X=3)=636,P(X=4)=436,P(X=5)=536

 그러면 X확률 질량 함수는 다음과 같다.

f(x)={16,x=0518,x=129,x=216,x=319,x=4118,x=50,다른 곳에서

 

(b)

두 눈의 차의 절댓값이 3일 확률은 P(X=3)=f(3)=16 이다.

 

(c)

두 눈의 차의 절댓값이 2 이상 4 이하일 확률은 다음과 같다.

P(2X4)=f(2)+f(3)+f(4)=29+16+19=12

 

(d)

두 눈의 차의 절댓값이 4 이상일 확률은 다음과 같다.

P(X4)=f(4)+f(5)=19+118=16

 

이산 확률 변수의 분포 함수(Distribution Function)

임의의 실수 x 에 대해 다음과 같이 정의되는 함수 F(x) 를 이산 확률 변수 X분포 함수(Distribution Function)라 한다.
F(x)=P(Xx)=uxf(u)
  • 동전을 두 번 던져서 앞면이 나온 횟수 X 에 대해 확률 P(Xx)=uxf(u) 를 구해보자.
  • 이를 위해 X 가 취하는 값 {0,1,2} 에 확률 f(x) 를 다음과 같이 표현할 수 있다.

임의의 x에 따른 확률 P(X <= x)

  • 그러면 위의 그림에서 보는 바와 같이 P(Xx) 의 값은 x<0,0x<1,1x<2,x2 에 따라 0이 아닌 f(x)합한 확률이다.
  • 따라서 임의의 실수 x 에 대해 확률 P(Xx) 는 다음과 같이 정의된다.
f(x)={0,x<014,0x<134,1x<21,x2
  • 즉, 이산 확률 변수 X확률 질량 함수 f(x) 에 대해 확률 P(Xx)분포 함수로 정의한다.

 

분포 함수와 확률

  • 임의의 두 수 a,b(a<b) 에 대해 분포 함수를 이용하여 다음과 같이 확률을 구할 수 있다.
P(a<Xb)=F(b)F(a) 
P(aXb)=F(b)F(a)+P(X=a)=F(b)F(a 바로 전)=F(b)P(X<a)
P(Xa)=1F(a)+P(X=a)=1P(X<a)
P(X=a)=F(a)F(a1)=F(a)F(a 바로 전)=F(a)P(X<a)

 

예제 : 주사위를 두 번 반복하여 던지는 시행에서 두 눈의 차의 절댓값을 확률 변수 X 라 할 때, 다음을 구하라.

(a) 확률 변수 X 의 분포 함수

(b) P(X=3)

(c) P(2X4)

(d) P(X4)

해설 보기

확률 변수 X 가 취하는 각각의 수에 대한 사건을 나타내면 다음과 같다.

X=0{(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}
X=1{(1,2),(2,1),(2,3),(3,2),(3,4),(4,3),(4,5),(5,4),(5,6),(6,5)}
X=2{(1,3),(3,1),(2,4),(4,2),(3,5),(5,3),(4,6),(6,4)}
X=3{(1,4),(4,1),(2,5),(5,3),(3,6),(6,3)}
X=4{(1,5),(5,1),(2,6),(6,2)}
X=5{(1,6),(6,1)}

따라서 확률 변수 X 가 취하는 각각의 수에 대한 확률을 구하면 다음과 같다.

P(X=0)=636,P(X=1)=1036,P(X=2)=836,P(X=3)=636,P(X=4)=436,P(X=5)=536

 그러면 X 확률 질량 함수는 다음과 같다.

f(x)={16,x=0518,x=129,x=216,x=319,x=4118,x=50,다른 곳에서

 

(a)

확률 변수 X 가 취하는 값 0,1,2,3,4,5 를 경계로 0이 아닌 f(x) 를 더하면 다음을 얻는다. (분포 함수)

F(x)={0,x<0636,0x<11636,1x<22436,2x<33036,3x<43436,4x<51,x5

 

(b)

P(X=3)=F(3)F(2)=30362436=636=16

 

(c)

P(2X4)=F(4)F(2)+P(X=2)=34362436+836=1836=12

 

(d)

P(X4)=1P(X3)=1F(3)=13036=636=16

 

분포 함수의 그래프

  • 한편, 동전을 두 번 던져서 나온 앞면의 횟수 X 에 대한 분포 함수 F(x)그래프는 다음과 같다.

확률 P(X<=x)의 그래프

  • 이 때, 분포 함수 F(x) 는 이산 확률 변수 X 가 취하는 값 0,1,2 에서 불연속이다.
  • 그리고 F(x) 가 불연속인 각 점에서 함수의 차이가 0.25,0.5,0.25 이며, 이는 X 가 취하는 값 0,1,2 에 대한 확률인 것을 알 수 있다.
  • 따라서 이산 확률 변수 X분포 함수 F(x) 를 알고 있다면, 확률 질량 함수 f(x) 를 구할 수 있다.

 

예제 : 다음 분포 함수를 갖는 이산 확률 변수 X 의 확률 질량 함수를 구하라.
F(x)={0,x<112,1x<323,3x<51,x5
해설 보기

분포 함수 F(x)x=1,3,5 에서 불연속이고, 각 점에서 함수의 차이는 각각 12,2312=16,123=13 이므로 X확률 질량 함수는 다음과 같다.

f(x)={12,x=116,x=313,x=50,다른 곳에서

 

728x90
728x90

이산 확률 변수이산 확률 변수의 의미확률 변수(Random Variable)이산 확률 변수(Discrete Random Variable)확률 질량 함수(Probability Mess Function)확률 질량 함수의 성질확률 분포(Probability Distribution)와 확률 히스토그램(Probability Histogram)이산 확률 변수의 분포 함수(Distribution Function)분포 함수와 확률분포 함수의 그래프