1.随机试验、随机事件、样本空间

  • 随机试验:每次出现的可能结果不止一个,且事先不能肯定会出现哪一个结果的试验

  • 随机事件:在一次试验中可能发生也可能不发生的事件

    • 分类:
      • 基本事件:相对于观察目的不可再分解的事件
      • 复合事件:两个及以上基本事件合并
    • 随机事件的概率:1≥P(A)≥01 \geq P(A)\geq 01P(A)0表示事件A发生概率
  • 样本点:随机试验的每个基本结果,记作eee

  • 样本空间:全体样本点的集合,记作SSS

在这里插入图片描述
e.g 掷骰子

S={i:i=1,2,3,4,5,6}S=\{i:i=1,2,3,4,5,6\}S={i:i=1,2,3,4,5,6}

2. 随机变量

  • 随机变量:定义在样本空间上的实值函数,简称为r.v.r.v.r.v.

    • 把随机试验结果数值化

    • 随试验结果的不同而取不同的值,在试验之前只知道它可能的取值范围,而不能预先肯定它将取的值

    • 由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率。

    • 随机变量通常用大写字母表示X,Y,ZX,Y,ZX,Y,Zζ,η\zeta,\etaζ,η,而随机变量所取的值,通常用小写字母x,y,zx,y,zx,y,z表示
      在这里插入图片描述

    • 分类:

      • 离散型随机变量:所有取值可以逐个一一列举
      • 连续型随机变量:全部可能取值无穷多
    • 随机事件与随机变量区别:

      1)随机变量包括随机事件

      2)随机变量是动态的观点,随机事件是静态的观点,如数学分析中常量与变量的区别

  • 离散型随机变量

    • 离散型随机变量X的概率函数(或分布律,或概率分布)

      xk(k=1,2,...)x_k(k=1,2,...)xk(k=1,2,...)是离散型随机变量X所取的一切可能值,称
      P(X=xk)=pk,k=1,2,... P(X=x_k)=p_k, k=1,2,... P(X=xk)=pk,k=1,2,...
      其中pk(k=1,2,...)p_k(k=1,2,...)pk(k=1,2,...)满足:

      (1) pk≥0,k=1,2,...p_k \geq 0,k=1,2,...pk0,k=1,2,...

      (2) ∑kpk=1\sum_kp_k=1kpk=1

    • 离散型随机变量X的概率规律

    在这里插入图片描述
    在这里插入图片描述

    • 离散型随机变量由它的概率函数唯一确定
  • 连续型随机变量

    • 连续型随机变量X的概率密度函数

      对于随机变量,如果存在非负可积函数f(x),x∈(−∞,+∞)f(x),x \in (-\infty,+\infty)f(x),x(,+),使得对任意a≤ba \leq bab,有
      P(a≤X≤b)=∫abf(x)dx P(a \leq X \leq b)=\int_a^bf(x)dx P(aXb)=abf(x)dx
      则称X为连续型r.vr.vr.v,称f(x)f(x)f(x)为X的概率密度函数,简称为概率密度。

      其中f(x)f(x)f(x)满足:

      (1)f(x)≥0f(x)\geq 0f(x)0

      (2)∫−∞∞f(x)dx=1\int_{-\infty}^{\infty}f(x)dx=1f(x)dx=1

在这里插入图片描述

  • f(x)f(x)f(x)进一步理解:

    xxxf(x)f(x)f(x)的连续点,则:
    limΔx→0p(x<X≤x+Δx)Δx=limΔx→0∫xx+Δxf(t)dtΔx=f(x) lim_{\Delta x\to 0}\frac{p(x<X\leq x+\Delta x)}{\Delta x}=lim_{\Delta x\to0}\frac{\int_x^{x+\Delta x}f(t)dt}{\Delta x}=f(x) limΔx0Δxp(x<Xx+Δx)=limΔx0Δxxx+Δxf(t)dt=f(x)
    故X的密度f(x)f(x)f(x)在x这一点的值,恰好是X落在区间(x,x+Δx](x,x+\Delta x](x,x+Δx]上的概率与区间长度Δx\Delta xΔx之比的极限。这里,如果把概率理解为质量,f(x)f(x)f(x)相当于线密度。

    密度函数f(x)f(x)f(x)在某点处aaa的高度,并不反映X取值的概率。但是,这个高度越大,则X取aaa附近的值的概率就越大。这说明某点密度曲线的高度反映了概率集中在该点附近的程度。

  • 连续型随机变量取任一指定值的概率为0

    即:P(X=a)=0P(X=a)=0P(X=a)=0aaa为任一指定值

    ∵P(x=a)=limΔx→0P(a≤X<a+Δx)=limΔ→0∫aa+Δxf(x)dx=0\because P(x=a)=lim_{\Delta x \to 0}P(a\leq X<a+\Delta x)=lim_{\Delta \to 0}\int_a^{a+\Delta x}f(x)dx=0P(x=a)=limΔx0P(aX<a+Δx)=limΔ0aa+Δxf(x)dx=0

  • 连续型随机变量唯一被它的密度函数所确定,所以,若已知密度函数,该连续型随机变量的概率规律就得到了全面描述

3.分布函数

  • 背景:为了对离散型的和连续型的r.vr.vr.v以及更广泛类型的r.vr.vr.v给出一种统一的描述方法,引进了分布函数的概念。它是一个普通的函数,通过它,我们可以用数学分析的工具来研究随机变量。

  • 定义:设X是一个r.vr.vr.v,称

    F(x)=P(X≤x),(−∞<x<+∞)​ F(x)=P(X\leq x),(-\infty<x<+\infty)​ F(x)=P(Xx),(<x<+)
    XXX的分布函数,记作XXX~F(x)F(x)F(x)FX(x)F_X(x)FX(x)

    上式中XXX是随机变量,xxx是参变量。F(x)F(x)F(x)是随机变量XXX取值不大于xxx的概率。

    如果将X看作数轴上随机点的坐标,那么分布函数F(x)F(x)F(x)的值就表示X落在区间(−∞,x](-\infty,x](,x]的概率。

    对任意实数x1<x2x_1<x_2x1<x2 ,随机点落在区间(x1,x2](x_1,x_2](x1,x2]的概率为:
    P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)​ P\{x_1<X\leq x_2\}=P\{X\leq x_2\}-P\{X\leq x_1\}=F(x_2)-F(x_1)​ P{x1<Xx2}=P{Xx2}P{Xx1}=F(x2)F(x1)
    因此,只要知道了随机变量XXX的分布函数,它的统计特性就可以得到全面的描述

  • 分布函数的性质:

    (1)F(x)F(x)F(x)非降,即若x1<x2x_1<x_2x1<x2,则F(x1)≤F(x2)F(x_1)\leq F(x_2)F(x1)F(x2)

    (2)F(−∞)=limx→−∞F(x)=0F(-\infty)=lim_{x\to -\infty}F(x)=0F()=limxF(x)=0

    F(+∞)=limx→+∞F(x)=1F(+\infty)=lim_{x\to +\infty}F(x)=1F(+)=limx+F(x)=1

    (3)F(x)F(x)F(x)右连续,即limx→x0+F(x)=F(x0)lim_{x\to x_0^+}F(x)=F(x_0)limxx0+F(x)=F(x0)

  • 离散型随机变量的分布函数

    设离散型随机变量XXX的概率函数是
    P{X=xk}=pk,k=1,2,3,... P\{X=x_k\}=p_k, \quad k=1,2,3,... P{X=xk}=pk,k=1,2,3,...

    F(x)=P(X≤x)=∑xk≤xpk F(x)=P(X\leq x)=\sum_{x_k\leq x}p_k F(x)=P(Xx)=xkxpk
    由于F(x)F(x)F(x)X≤xX\leq xXx的诸值xkx_kxk的概率之和,故又称F(x)F(x)F(x)为累积概率函数

  • 连续型随机变量的分布函数

    XXX是连续型随机变量,XXX~f(x)f(x)f(x),则
    F(x)=P(X≤x)=∫−∞xf(t)dt F(x)=P(X\leq x)=\int_{-\infty}^xf(t)dt F(x)=P(Xx)=xf(t)dt
    即分布函数是密度函数的可变上限不定积分

    由上式可得,在f(x)f(x)f(x)的连续点处,有
    dF(x)dx=f(x) \frac{dF(x)}{dx}=f(x) dxdF(x)=f(x)

在这里插入图片描述

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐