PromleeBlog
sitemapaboutMe

posting thumbnail
조건부 확률질량함수
Conditional PMF

📅

🚀

확률 변수에 대한 조건화 (Conditioning a Random Variable on an Event)🔗

사건 A에 대해 조건화된 확률 변수 X의 조건부 확률 질량 함수(Conditional PMF)는 P(A)>0P(A) > 0일 때 다음과 같이 정의된다.
pXA(x)=P(X=xA)=P({X=x}A)P(A)p_{X|A}(x) = P(X = x | A) = \frac{P(\{X = x\} \cap A)}{P(A)}

예시 (확률 변수에 대한 조건화)🔗

X를 주사위를 굴려 나온 수라고 하고, A를 주사위의 눈금이 짝수인 사건이라고 하자.
앞서 언급한 공식을 적용하면 다음과 같은 결과를 얻는다.
pXA(x)=P(X=x주사위 눈금이 짝수)p_{X|A}(x) = P(X = x | \text{주사위 눈금이 짝수})
=P(X=x 그리고 X가 짝수)P(주사위 눈금이 짝수)= \frac{P(X = x \text{ 그리고 } X \text{가 짝수})}{P(\text{주사위 눈금이 짝수})}
={1/3if x=2,4,6,0otherwise.= \left\{\begin{array}{ll}1/3 & \text{if } x = 2, 4, 6, \\0 & \text{otherwise}.\end{array}\right.

🚀

다른 확률 변수에 대한 조건화 (Conditioning one Random Variable on Another)🔗

확률 변수 X와 Y가 동일한 실험과 관련되어 있을 때, Y에 대해 조건화된 X의 조건부 확률 질량 함수를 정의한다.
Conditional PMF of X given Y: pXY(xy)=P(X=xY=y)p_{X|Y}(x | y) = P(X = x | Y = y)
이는 사건 A의 형태 {Y=y}\{Y = y\}로 정의의 특수화와 같다.
조건부 확률의 정의를 사용하면 다음과 같다.

예시🔗

Joint Probability Mass Function (P(X,Y)):
X \ Y1234
10.10.100.2
20.050.050.10
300.10.20.1
Marginal Probability P(Y):
Y1234
P(Y)0.150.250.30.3
Conditional Probability Mass Function (P(X|Y)):
X \ Y1234
10.660.400.66
20.330.20.330
300.40.660.33
첫 번째 표는 XXYY
합동 확률 분포
를 보여준다.
예를 들어, P(X=1,Y=1)=0.1P(X=1, Y=1) = 0.1, P(X=2,Y=1)=0.05P(X=2, Y=1) = 0.05이다.
두 번째 표는 YY의 값에 대한
주변 확률 분포
를 보여준다.
예를 들어, P(Y=1)=0.15P(Y=1) = 0.15, P(Y=2)=0.25P(Y=2) = 0.25이다.
세 번째 표는 YY가 주어졌을 때 XX
조건부 확률 분포
를 보여준다.
예를 들어, P(X=1Y=1)=0.66P(X=1|Y=1) = 0.66, P(X=2Y=1)=0.33P(X=2|Y=1) = 0.33이다.

Conditional PMF 계산순서
  1. Joint PMF 계산
  2. Marginalization
  3. Marginal PMF 계산
  4. Conditional PMF 계산 = Joint PMF / Marginal PMF
예시)
  1. Joint PMF: $P(X=2, Y=1)
  2. Marginal PMF: $P(Y=1)
  3. Conditional PMF: P(X=2Y=1)=P(X=2,Y=1)P(Y=1)=0.050.15=0.33P(X=2|Y=1) = \frac{P(X=2, Y=1)}{P(Y=1)} = \frac{0.05}{0.15} = 0.33

🚀

유용한 공식 (Useful Rules)🔗

➡️

조건부 PMF(Conditional PMF)로부터 결합 PMF(Joint PMF)를 계산하는 방법🔗

Y=yY=y일 때 XX의 조건부 PMF는 결합 PMF와 관련이 있다.
pX,Y(x,y)=pY(y)pXY(xy)p_{X,Y}(x, y) = p_Y(y) p_{X|Y}(x | y)
이는 확률을 계산할 때 사용되는 곱셈 규칙과 유사하다.
➡️

조건부 PMF(Conditional PMF)로부터 주변 PMF(Marginal PMF)를 계산하는 방법🔗

YY가 주어졌을 때 XX의 조건부 PMF를 사용하여 XX의 주변 PMF를 계산할 수 있다.
pX(x)=ypY(y)pXY(xy)p_X(x) = \sum_y p_Y(y) p_{X|Y}(x | y)
이는 확률을 계산할 때 사용되는 전체 확률 정리와 유사하다.
p(X)=yp(Y)p(XY)p(X) = \sum_y p(Y) p(X | Y)

예제 (다른 확률 변수에 대한 조건화)🔗

➡️

문제🔗

6면 주사위를 독립적으로 네 번 던진다.
XX는 나온 1의 개수를 나타내고, YY는 나온 2의 개수를 나타낸다.
XXYY의 결합 확률 질량 함수(Joint PMF)를 구하라.
➡️

풀이🔗

X: 4번의 시도 중 나온 1의 개수, Y: 4번의 시도 중 나온 2의 개수
X, Y : Binomial R.V (n = 4, p = 1/6)
P(X=x,Y=y)=P(Y=y)P(X=xY=y)P(X = x, Y = y) = P(Y = y)P(X = x | Y = y)
이때, P(Y=y)=(4y)(16)y(56)4yP(Y = y) = \binom{4}{y} \left(\frac{1}{6}\right)^y \left(\frac{5}{6}\right)^{4-y}이다.
P(X=xY=y)P(X = x | Y = y)에서
주변 확률 질량 함수(Marginal PMF) pYp_{Y}는 이항 분포(Binomial PMF)를 따른다.
Y=yY = y가 주어졌을 때, 남은 4y4-y번의 주사위 던짐에서 1이 나올 확률을 나타내는 조건부 PMF pXYp_{X|Y}는 이항 분포다.
결합 PMF
는 다음과 같이 주어진다.
pX,Y(x,y)=pY(y)×pXY(xy)=(4y)(16)y(56)4y×(4yx)(15)x(45)4yxp_{X,Y}(x, y) = p_Y(y) \times p_{X|Y}(x|y) = \binom{4}{y} \left(\frac{1}{6}\right)^y \left(\frac{5}{6}\right)^{4-y} \times \binom{4-y}{x} \left(\frac{1}{5}\right)^x \left(\frac{4}{5}\right)^{4-y-x}
이 식은 모든 비음수 정수 xxyy에 대해 0x+y40 \leq x + y \leq 4일 때 유효하다.

🚀

조건부 기대값 (Conditional Expectation)🔗

조건부 기대값은 사건 AA가 일어날 확률 P(A)>0P(A) > 0이 주어졌을 때 정의된다.
함수 g(X)g(X)에 대해서는 다음과 같이 주어진다.
확률 변수 YY가 특정 값 yy를 가질 때 XX의 조건부 기대값은 다음과 같이 정의된다.

🚀

전체 기대값 정리 (Total Expectation Theorem)🔗

전체 기대값 정리는 확률 변수 XX의 기대값을 다음과 같이 정의한다.
이는
전체 확률 정리
와 유사한 개념으로 확률을 계산하는 데 사용된다.

예제 1 (전체 기대값 정리)🔗

➡️

문제🔗

시스템은 각 단계에서 독립적으로 확률 pp로 실패할 수 있다.
확률 변수 XX는 첫 번째 실패가 일어나기까지의 단계 수를 나타낸다.
AA는 시스템이 첫 번째 단계에서 실패하는 사건이다.
  1. ACA^C = ?
  2. P(A)P(A) = ?
  3. P(AC)P(A^C) = ?
  4. E[XA]E[X|A] = ?
  5. E[XAC]E[X|A^C] = ?
➡️

풀이🔗

PXx=(1p)x1pP_Xx = (1-p)^{x-1}p이다.
P(X=1)=pP(X=1)=p, P(X=2)=(1p)pP(X=2)=(1-p)p, P(X=3)=(1p)2pP(X=3)=(1-p)^2p, \dots
  1. AC={X>1}A^C=\{X>1\}
  2. P(A)=P(X=1)=pP(A)=P(X=1)=p
  3. P(AC)=1P(A)=1pP(A^C)=1-P(A)=1-p
  4. E[XA]=x=1xP(X=xX=1)=1P(X=1X=1)+2P(X=2X=1)+3P(X=3X=1)+=P(X=1X=1)+2P(X=2X=1)+3P(X=3X=1)+P(X=1)=P(X=1)P(X=1)+0+0+=1E[X|A] = \sum_{x=1}^{\infty} x \cdot P(X=x|X=1) \\ =1\cdot P(X=1|X=1)+2\cdot P(X=2|X=1)+3\cdot P(X=3|X=1)+\dots \\ = \frac{P(X=1 \cap X=1)+2\cdot P(X=2 \cap X=1)+3\cdot P(X=3 \cap X=1)+\dots}{P(X=1)} \\ = \frac{P(X=1)}{P(X=1)} + 0 + 0 + \dots \\ = 1
  5. E[XAC]=x=1xP(X=xX>1)=2P(X=2X>1)+3P(X=3X>1)+=2P(X=2X>1)+3P(X=3X>1)+P(X>1)=2P(X=2)+3P(X=3)+1P(X=1)=P(X=1)+2P(X=2)+3P(X=3)+P(X=1)1P(X=1)=E[X]P(X=1)1P(X=1)=E[X]p1pE[X|A^C]= \sum_{x=1}^{\infty} x \cdot P(X=x|X>1) \\ =2\cdot P(X=2|X>1)+3\cdot P(X=3|X>1)+\dots \\ = \frac{2\cdot P(X=2 \cap X>1)+3\cdot P(X=3 \cap X>1)+\dots}{P(X>1)} \\ = \frac{2\cdot P(X=2)+3\cdot P(X=3)+\dots}{1-P(X=1)} \\ = \frac{P(X=1)+2\cdot P(X=2)+3\cdot P(X=3)+\dots - P(X=1)}{1-P(X=1)} \\ = \frac{E[X] - P(X=1)}{1-P(X=1)} \\ = \frac{E[X] - p}{1-p}

예제 2 (전체 기대값 정리)🔗

➡️

문제🔗

E[XA]P(A)+E[XAC]P(AC)E[X|A]P(A) + E[X|A^C]P(A^C)를 계산하시오.
➡️

풀이🔗

E[XA]P(A)+E[XAC]P(AC)=P(A)E[XA]+P(AC)E[XAC]=p1+(1p)E[X]p1p=p+E[X]p=E[X]E[X|A]P(A) + E[X|A^C]P(A^C) \\ = P(A)E[X|A] + P(A^C)E[X|A^C] \\ = p\cdot 1 + (1-p)\cdot \frac{E[X] - p}{1-p} \\ = p + E[X] - p \\ = E[X] \Rightarrow
전체 기대값 정리

🚀

요약 (Summary)🔗

확률 변수에 대한 조건화
(Conditioning on a Random Variable)
조건부 PMF
(Conditional PMF)로부터
결합 PMF
(Joint PMF)를 계산하는 방법
조건부 PMF
(Conditional PMF)로부터
주변 PMF
(Marginal PMF)를 계산하는 방법
조건부 기대값
(Conditional Expectation)
전체 기대값 정리
(Total Expectation Theorem)
A1,A2,,AnA_1, A_2, \dots, A_n
확률 공간의 분할
이라면

🚀

추가문제🔗

➡️

문제🔗

길을 잃은 관광객이 세 갈래 길이 있는 지점에 도착한다.
첫 번째 길은 그를 1시간 후에 같은 지점으로 되돌아오게 한다.
두 번째 길은 그를 6시간 후에 같은 지점으로 되돌아오게 한다.
마지막 길은 그를 2시간 후에 도시로 데려다 준다.
길에는 표지판이 없다.
관광객이 항상 동일한 확률로 길을 선택한다고 가정할 때, 관광객이 도시에 도착할 때까지의 평균 시간은 얼마인가?
➡️

풀이🔗

TT = 관광객이 도시에 도착할 때까지의 평균 시간
DiD_i = 관광객이 ii번째 길을 선택한 사건
E[TDi]E[T|D_i] = 관광객이 ii번째 길을 선택했을 때 도시에 도착할 때까지의 평균 시간
P(Di)P(D_i) = 관광객이 ii번째 길을 선택할 확률
E[T]=i=13P(Di)E[TDi]=13E[TD1]+13E[TD2]+13E[TD3]=13(1+E[T]+6+E[T]+2)=13(9+2E[T])E[T]=13(9+2E[T])3E[T]=9+2E[T]E[T]=9E[T] = \sum_{i=1}^{3} P(D_i)E[T|D_i]\\ = \frac{1}{3}E[T|D_1] + \frac{1}{3}E[T|D_2] + \frac{1}{3}E[T|D_3]\\ = \frac{1}{3}(1 + E[T] + 6 + E[T] + 2)\\ = \frac{1}{3}(9 + 2E[T])\\ E[T] = \frac{1}{3}(9 + 2E[T])\\ 3E[T] = 9 + 2E[T]\\ E[T] = 9시간