二项分布

1.贝努里概型
  • 定义:n次独立重复试验称作n重贝努里试验,每次试验成功的概率都是p,失败的概率都是q=1-p

  • 内容:

    用X表示n重贝努里试验中事件A(成功)出现的次数,则
    P(X=k)=Cnkpk(1−p)n−k,k=0,1,...,n P(X=k)=C_n^kp^k(1-p)^{n-k},k=0,1,...,n P(X=k)=Cnkpk(1p)nk,k=0,1,...,n
    不难验证:
    a.P(X=k)≥0b.∑k=0nP(X=k)=1 a.P(X=k)\geq0 \\ b.\sum_{k=0}^nP(X=k)=1 a.P(X=k)0b.k=0nP(X=k)=1

  • 二项分布

    • r.vXr.v Xr.vX服从参数为n和p的二项分布,记作X~B(n,p)

    • 二项分布描述的是n重贝努里试验中出现“成功”次数X的概率分布

    • 图形特点:对于固定n及p,当k增加时,概率P(X=k)先是增加至达到最大值,随后单调减少。

      • 当(n+1)p不为整数时,二项概率P(X=k)P(X=k)P(X=k)k=[(n+1)p]k=[(n+1)p]k=[(n+1)p]达到最大值。

        ([x]表示不超过x的最大整数)

      • 当(n+1)p为整数时,二项概率P(X=k)P(X=k)P(X=k)k=(n+1)pk=(n+1)pk=(n+1)pk=(n+1)p−1k=(n+1)p-1k=(n+1)p1达到最大值。

    • 当n=1时,P(X=k)=pk(1−p),k=0,1P(X=k)=p^k(1-p),k=0,1P(X=k)=pk(1p),k=0,1。称X服从0-1分布

在这里插入图片描述

  • 使用条件:

    • 每次试验条件相同

    • 每次试验只考虑两个互逆结果AAAA‾\overline AA,且P(A)=p,P(A‾)=1−pP(A)=p,P(\overline A)=1-pP(A)=p,P(A)=1p

    • 各次试验相互独立

2. 二项分布的泊松近似
  • 背景:当试验次数n很大时,计算二项概率变得很麻烦。

    • 如1000件产品,只有一件次品,要求有放回地抽5000次,其中至少5次出现次品的概率。

      则要计算
      P(X>5)=∑k=65000P(X=k)=∑k=65000C5000k(11000)k(9991000)5000−k P(X>5)=\sum^{5000}_{k=6}P(X=k)=\sum^{5000}_{k=6}C^k_{5000}(\frac{1}{1000})^k(\frac{999}{1000})^{5000-k} P(X>5)=k=65000P(X=k)=k=65000C5000k(10001)k(1000999)5000k
      因此必须寻求近似方法,由此引入二项分布的泊松近似

  • 泊松定理

    λ\lambdaλ是一个正整数,pn=λnp_n=\frac{\lambda}{n}pn=nλ,则有
    limn→∞Cnkpnk(1−pn)n−k=e−λλkk!, k=0,1,2,... lim_{n\to \infty}C_n^kp_n^k(1-p_n)^{n-k}=e^{-\lambda}\frac{\lambda^k}{k!},\space k=0,1,2,... limnCnkpnk(1pn)nk=eλk!λk, k=0,1,2,...
    定理的条件意味着当n很大时,pnp_npn必定很小。因此,泊松定理表明,当n很大,p很小时有以下近似式:
    Cnkpnk(1−pn)n−k≈e−λλkk!, λ=np C_n^kp_n^k(1-p_n)^{n-k}\approx e^{-\lambda}\frac{\lambda^k}{k!}, \space \lambda=np Cnkpnk(1pn)nkeλk!λk, λ=np
    实际计算中, n≥100,np≤10n\geq 100,np\leq 10n100,np10时近似效果就很好。

3. 二项分布的正态近似
  • 定理(棣莫佛-拉普拉斯定理)

    设随机变量YnY_nYn服从参数n,p(0<p<1)n,p(0<p<1)n,p(0<p<1)的二项分布,则对任意x,有
    limn→∞P{Yn−npnp(1−p)≤x}=∫−∞x12πexp(−t22)dt lim_{n\to \infty}P\{\frac{Y_n-np}{\sqrt{np(1-p)}}\leq x\}=\int_{-\infty}^x\frac{1}{\sqrt{2\pi}}exp(-\frac{t^2}{2})dt limnP{np(1p) Ynnpx}=x2π 1exp(2t2)dt
    当n很大,0<p<10<p<10<p<1是一个定值时,或者说,np(1−p)np(1-p)np(1p)也不太小时,二项变量YnY_nYn的分布近似正态分布N(np,np(1−p))N(np,np(1-p))N(np,np(1p)).

    实用中,n≥30n\geq30n30,np≥10np\geq 10np10时,正态近似的效果较好

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐