机器学习|随机变量(连续型、离散型)+分布函数|10mins入门|概统学习笔记(一)
1.随机试验、随机事件、样本空间随机试验:每次出现的可能结果不止一个,且事先不能肯定会出现哪一个结果的试验随机事件:在一次试验中可能发生也可能不发生的事件分类:基本事件:相对于观察目的不可再分解的事件复合事件:两个及以上基本事件合并随机事件的概率:1≥P(A)≥01 \geq P(A)\geq 01≥P(A)≥0表示事件A发生概率样本点:随机试验的每个基本结果,...
1.随机试验、随机事件、样本空间
-
随机试验:每次出现的可能结果不止一个,且事先不能肯定会出现哪一个结果的试验
-
随机事件:在一次试验中可能发生也可能不发生的事件
- 分类:
- 基本事件:相对于观察目的不可再分解的事件
- 复合事件:两个及以上基本事件合并
- 随机事件的概率:1≥P(A)≥01 \geq P(A)\geq 01≥P(A)≥0表示事件A发生概率
- 分类:
-
样本点:随机试验的每个基本结果,记作eee
-
样本空间:全体样本点的集合,记作SSS
e.g 掷骰子
S={i:i=1,2,3,4,5,6}S=\{i:i=1,2,3,4,5,6\}S={i:i=1,2,3,4,5,6}
2. 随机变量
-
随机变量:定义在样本空间上的实值函数,简称为r.v.r.v.r.v.
-
把随机试验结果数值化
-
随试验结果的不同而取不同的值,在试验之前只知道它可能的取值范围,而不能预先肯定它将取的值
-
由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率。
-
随机变量通常用大写字母表示X,Y,ZX,Y,ZX,Y,Z或ζ,η\zeta,\etaζ,η,而随机变量所取的值,通常用小写字母x,y,zx,y,zx,y,z表示
-
分类:
- 离散型随机变量:所有取值可以逐个一一列举
- 连续型随机变量:全部可能取值无穷多
-
随机事件与随机变量区别:
1)随机变量包括随机事件
2)随机变量是动态的观点,随机事件是静态的观点,如数学分析中常量与变量的区别
-
-
离散型随机变量
-
离散型随机变量X的概率函数(或分布律,或概率分布)
设xk(k=1,2,...)x_k(k=1,2,...)xk(k=1,2,...)是离散型随机变量X所取的一切可能值,称
P(X=xk)=pk,k=1,2,... P(X=x_k)=p_k, k=1,2,... P(X=xk)=pk,k=1,2,...
其中pk(k=1,2,...)p_k(k=1,2,...)pk(k=1,2,...)满足:(1) pk≥0,k=1,2,...p_k \geq 0,k=1,2,...pk≥0,k=1,2,...
(2) ∑kpk=1\sum_kp_k=1∑kpk=1
-
离散型随机变量X的概率规律
- 离散型随机变量由它的概率函数唯一确定
-
-
连续型随机变量
-
连续型随机变量X的概率密度函数
对于随机变量,如果存在非负可积函数f(x),x∈(−∞,+∞)f(x),x \in (-\infty,+\infty)f(x),x∈(−∞,+∞),使得对任意a≤ba \leq ba≤b,有
P(a≤X≤b)=∫abf(x)dx P(a \leq X \leq b)=\int_a^bf(x)dx P(a≤X≤b)=∫abf(x)dx
则称X为连续型r.vr.vr.v,称f(x)f(x)f(x)为X的概率密度函数,简称为概率密度。其中f(x)f(x)f(x)满足:
(1)f(x)≥0f(x)\geq 0f(x)≥0
(2)∫−∞∞f(x)dx=1\int_{-\infty}^{\infty}f(x)dx=1∫−∞∞f(x)dx=1
-
-
对f(x)f(x)f(x)进一步理解:
若xxx是f(x)f(x)f(x)的连续点,则:
limΔx→0p(x<X≤x+Δx)Δx=limΔx→0∫xx+Δxf(t)dtΔx=f(x) lim_{\Delta x\to 0}\frac{p(x<X\leq x+\Delta x)}{\Delta x}=lim_{\Delta x\to0}\frac{\int_x^{x+\Delta x}f(t)dt}{\Delta x}=f(x) limΔx→0Δxp(x<X≤x+Δx)=limΔx→0Δx∫xx+Δxf(t)dt=f(x)
故X的密度f(x)f(x)f(x)在x这一点的值,恰好是X落在区间(x,x+Δx](x,x+\Delta x](x,x+Δx]上的概率与区间长度Δx\Delta xΔx之比的极限。这里,如果把概率理解为质量,f(x)f(x)f(x)相当于线密度。密度函数f(x)f(x)f(x)在某点处aaa的高度,并不反映X取值的概率。但是,这个高度越大,则X取aaa附近的值的概率就越大。这说明某点密度曲线的高度反映了概率集中在该点附近的程度。
-
连续型随机变量取任一指定值的概率为0
即:P(X=a)=0P(X=a)=0P(X=a)=0,aaa为任一指定值
∵P(x=a)=limΔx→0P(a≤X<a+Δx)=limΔ→0∫aa+Δxf(x)dx=0\because P(x=a)=lim_{\Delta x \to 0}P(a\leq X<a+\Delta x)=lim_{\Delta \to 0}\int_a^{a+\Delta x}f(x)dx=0∵P(x=a)=limΔx→0P(a≤X<a+Δx)=limΔ→0∫aa+Δxf(x)dx=0
-
连续型随机变量唯一被它的密度函数所确定,所以,若已知密度函数,该连续型随机变量的概率规律就得到了全面描述
3.分布函数
-
背景:为了对离散型的和连续型的r.vr.vr.v以及更广泛类型的r.vr.vr.v给出一种统一的描述方法,引进了分布函数的概念。它是一个普通的函数,通过它,我们可以用数学分析的工具来研究随机变量。
-
定义:设X是一个r.vr.vr.v,称
F(x)=P(X≤x),(−∞<x<+∞) F(x)=P(X\leq x),(-\infty<x<+\infty) F(x)=P(X≤x),(−∞<x<+∞)
为XXX的分布函数,记作XXX~F(x)F(x)F(x)或FX(x)F_X(x)FX(x)。上式中XXX是随机变量,xxx是参变量。F(x)F(x)F(x)是随机变量XXX取值不大于xxx的概率。
如果将X看作数轴上随机点的坐标,那么分布函数F(x)F(x)F(x)的值就表示X落在区间(−∞,x](-\infty,x](−∞,x]的概率。
对任意实数x1<x2x_1<x_2x1<x2 ,随机点落在区间(x1,x2](x_1,x_2](x1,x2]的概率为:
P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1) P\{x_1<X\leq x_2\}=P\{X\leq x_2\}-P\{X\leq x_1\}=F(x_2)-F(x_1) P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)
因此,只要知道了随机变量XXX的分布函数,它的统计特性就可以得到全面的描述 -
分布函数的性质:
(1)F(x)F(x)F(x)非降,即若x1<x2x_1<x_2x1<x2,则F(x1)≤F(x2)F(x_1)\leq F(x_2)F(x1)≤F(x2)
(2)F(−∞)=limx→−∞F(x)=0F(-\infty)=lim_{x\to -\infty}F(x)=0F(−∞)=limx→−∞F(x)=0
F(+∞)=limx→+∞F(x)=1F(+\infty)=lim_{x\to +\infty}F(x)=1F(+∞)=limx→+∞F(x)=1
(3)F(x)F(x)F(x)右连续,即limx→x0+F(x)=F(x0)lim_{x\to x_0^+}F(x)=F(x_0)limx→x0+F(x)=F(x0)
-
离散型随机变量的分布函数
设离散型随机变量XXX的概率函数是
P{X=xk}=pk,k=1,2,3,... P\{X=x_k\}=p_k, \quad k=1,2,3,... P{X=xk}=pk,k=1,2,3,...
则
F(x)=P(X≤x)=∑xk≤xpk F(x)=P(X\leq x)=\sum_{x_k\leq x}p_k F(x)=P(X≤x)=xk≤x∑pk
由于F(x)F(x)F(x)是X≤xX\leq xX≤x的诸值xkx_kxk的概率之和,故又称F(x)F(x)F(x)为累积概率函数 -
连续型随机变量的分布函数
若XXX是连续型随机变量,XXX~f(x)f(x)f(x),则
F(x)=P(X≤x)=∫−∞xf(t)dt F(x)=P(X\leq x)=\int_{-\infty}^xf(t)dt F(x)=P(X≤x)=∫−∞xf(t)dt
即分布函数是密度函数的可变上限不定积分由上式可得,在f(x)f(x)f(x)的连续点处,有
dF(x)dx=f(x) \frac{dF(x)}{dx}=f(x) dxdF(x)=f(x)
更多推荐
所有评论(0)