机器学习|条件分布(离散型、连续型随机变量)|10mins入门|概统学习笔记(四)
条件分布背景:在事件B发生的条件下事件A发生的条件概率:P(A∣B)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)}P(A∣B)=P(B)P(AB)随机变量条件分布:设有两个随机变量X,Y,在给定Y取某个或某些值的条件下,求X的概率分布条件分布是一种概率分布,它具有概率分布的一切性质,正如条件概率是一种概率,具有概率的一切性质例如:P(X=xi...
条件分布
-
背景:在事件B发生的条件下事件A发生的条件概率:
P(A∣B)=P(AB)P(B) P(A|B)=\frac{P(AB)}{P(B)} P(A∣B)=P(B)P(AB) -
随机变量条件分布:设有两个随机变量X,Y,在给定Y取某个或某些值的条件下,求X的概率分布
-
条件分布是一种概率分布,它具有概率分布的一切性质,正如条件概率是一种概率,具有概率的一切性质
- 例如:
P(X=xi∣Y=yj)≥0,i=1,2,...∑i=1∞P(X=xi∣Y=yj)=1 P(X=x_i|Y=y_j)\geq0, \quad i=1,2,... \\ \sum_{i=1}^\infty P(X=x_i|Y=y_j)=1 P(X=xi∣Y=yj)≥0,i=1,2,...i=1∑∞P(X=xi∣Y=yj)=1
- 例如:
-
离散型随机变量的条件分布
-
设(X,Y)是二维离散型随机变量,对于固定的j,若P(Y=yj)>0P(Y=y_j)>0P(Y=yj)>0,则称
P(X=xi∣Y=yj)=P(X=xi,Y=yj)P(Y=yj)=pijpj,i=1,2,... P(X=x_i|Y=y_j)=\frac{P(X=x_i,Y=y_j)}{P(Y=y_j)}=\frac{p_{ij}}{p_j},i=1,2,... P(X=xi∣Y=yj)=P(Y=yj)P(X=xi,Y=yj)=pjpij,i=1,2,...
为在Y=yjY=y_jY=yj条件下随机变量X的条件概率函数 -
求条件分布,先求边缘分布
-
-
连续型随机变量的条件分布
-
设(X,Y)是二维连续型随机变量,由于对任意x,y,P(X=x)=0,P(Y=y)=0x,y,P(X=x)=0,P(Y=y)=0x,y,P(X=x)=0,P(Y=y)=0,所以不能直接用条件概率公式得到条件分布。
设X和Y的联合概率密度为f(x,y)f(x,y)f(x,y),边缘概率密度为fX(x),fY(y)f_X(x),f_Y(y)fX(x),fY(y),
则对一切使fX(x)>0f_X(x)>0fX(x)>0的x,定义已知X=x下,Y的条件密度函数为
fY∣X(y∣x)=f(x,y)fX(x) f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)} fY∣X(y∣x)=fX(x)f(x,y)
同样,对一切使fY(y)>0f_Y(y)>0fY(y)>0的y,定义已知Y=y下,X的条件密度函数为
fX∣Y(x∣y)=f(x,y)fY(y) f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)} fX∣Y(x∣y)=fY(y)f(x,y)
将上式左边乘以dxdxdx,右边乘以dxdydy\frac{dx dy}{dy}dydxdy既得
fX∣Ydx=f(x,y)dxdyfY(y)dy≈P{x≤X<x+dx,y≤Y≤y+dy}p{y≤Y≤y+dy}=P{x≤X≤x+dx∣y≤Y<y+dy} f_{X|Y}dx=\frac{f(x,y)dxdy}{f_Y(y)dy}\approx \frac{P\{x\leq X<x+dx,y\leq Y \leq y+ dy\}}{p\{y\leq Y\leq y+dy\}} \\ =P\{x \leq X \leq x+ dx |y \leq Y < y+dy\} fX∣Ydx=fY(y)dyf(x,y)dxdy≈p{y≤Y≤y+dy}P{x≤X<x+dx,y≤Y≤y+dy}=P{x≤X≤x+dx∣y≤Y<y+dy} -
若(X, Y)是连续型随机变量,则对任一集合A,
P(X∈A∣Y=y)=∫AfX∣Y(x∣y)dx P(X\in A|Y=y) = \int_A f_{X|Y}(x|y)dx P(X∈A∣Y=y)=∫AfX∣Y(x∣y)dx
特别,取A=(−∞,u)A=(-\infty,u)A=(−∞,u),定义在已知条件Y=y下,X的条件分布函数为
FX∣Y(u∣y)=P(X≤u∣Y=y)=∫−∞ufX∣Y(x∣y)dx F_{X|Y}(u|y)=P(X\leq u|Y=y)=\int_{-\infty}^uf_{X|Y}(x|y)dx FX∣Y(u∣y)=P(X≤u∣Y=y)=∫−∞ufX∣Y(x∣y)dx
-
更多推荐
所有评论(0)