跳转至

Bernoulli 试验与直线上的随机游动

Bernoulli 试验与二项分布

Bernoulli 试验的定义

定义

将事件域取为 \(\mathscr{F}= \left\lbrace \varnothing,A,\overline{A} \right\rbrace\) ,称 \(A\) 出现为成功,\(\overline{A}\) 出现为失败,则这种只有两个可能结果的试验称为 Bernoulli 试验.

进行重复 \(n\) 次独立的 Bernoulli 试验,这里的重复是指每次 \(A\) 的概率保持不变,这种试验称为 \(n\) 重 Bernoulli 试验. 它有以下四个约定:

  • 每次试验至多出现两个可能结果之一:\(A\)\(\overline{A}\) .
  • \(A\) 在每次试验中出现的概率 \(p\) 保持不变.
  • 每次试验相互独立. (这是非常重要的一点)
  • 共进行 \(n\) 次试验.

其样本点形如:

\[ (\hat{A}_1,\cdots,\hat{A}_n) \]

Bernoulli 试验的概率计算

设样本点当中有 \(k\)\(A\)\(n-k\)\(\overline{A}\) ,那么有

\[ P(\hat{A}_1\cdots\hat{A}_n) = p^k(1-p)^{n-k} \]

并且这样的情形总共有 \(\binom{n}{k}\) 种,因此对于从 \(n\) 个中取 \(k\) 次成功的概率为:

\[ b(k;n,p)= \binom{n}{k}p^k q^{n-k} ,k=0,1,2,\cdots,n \]

有放回抽样

有放回抽样

若在 \(N\) 件产品当中有 \(M\) 件废品,现在进行 \(n\) 次有放回的抽样检查,共抽到 \(k\) 件废品的概率是多少?

直接利用 \(n\) 重 Bernoulli 试验即可:

\[ b\left(k;n, \frac{M}{N}\right) = \binom{n}{k} \left(\frac{M}{N}\right)^k \left(1- \frac{M}{N}\right)^{n-k} \]

\(\square\)

二项分布

对 Bernoulli 试验的概率进行考察,可以注意到 \(b(k;n,p)\) 是二项式 \((q+ps)^n\)\(s^n\) 的展开系数,因此 \(b(k;n,p)\) 也称为二项分布.
需要验证概率之和为 \(1\)

\[ \sum\limits_{k=0}^n b(k;n,p) = \sum\limits_{k=0}^n \binom{n}{k}p^k q^{n-k}=(q+p)^n = 1 \]

几何分布

现在讨论在 Bernoulli 试验当中首次成功出现在第 \(k\) 次试验的概率,要使首次成功出现在第 \(k\) 次试验,必须而且只需在前 \(k-1\) 次试验中都出现事件 \(\overline{A}\) .

利用试验独立性有:

\[ P(\overline{A}_1 \overline{A}_2\cdots \overline{A}_{k-1}A_k) = q^{k-1}p \]

从而

\[ g(k;p) = q^{k-1}p \quad k=1,2,\cdots \]

验证求和为 \(1\)

\[ \sum\limits_{k=1}^\infty g(k;p) = \sum\limits_{k=1}^\infty q^{k-1}p = p \frac{1}{1-q} = 1 \]

Pascal 分布

Pascal 分布的定义与性质

考虑 Bernoulli 试验要多长时间才会出现第 \(r\) 次成功.

\(C_k\) 为第 \(r\) 次成功发生在第 \(k\) 次试验这一事件当中,并且以 \(f(k;r,p)\) 来记录这个概率.

\(C_k\) 发生当且仅当前面的 \(k-1\) 次试验中有 \(r-1\) 次成功,\(k-r\) 次失败,从而有:

\[ P(C_k) = \binom{k-1}{r-1} p^{r-1}q^{k-r}\cdot p \]

那么现在就有

\[ f(k;r,p) = \binom{k-1}{r-1}p^{r}q^{k-r} \]

现在问题来了,我们如何证明其求和为 \(1\)

\[ \begin{aligned} \sum\limits_{k=r}^\infty f(k;r,p) &= \sum\limits_{k=r}^\infty \binom{k-1}{r-1} p^r q^{k-r} \\ &= \sum\limits_{l=0}^\infty \binom{r+l-1}{r-1}p^r q^l = \sum\limits_{l=0}^\infty \binom{r+l-1}{l}p^r q^l \\ & = \sum\limits_{l=0}^\infty \binom{-r}{l}(-1)^l p^r q^l =p^r(1-q)^{-r} = 1 \end{aligned} \]

这里面其实用到了一些求和的通法:

  • 首先观察组合数,我们发现变元在较大的一方,我们作变换:
    • 先用 \(k=l+r\) 换为我们相对好变换的形式;
    • 使上下均有变元,我们发现其形式和古典概型一章中学到的推广组合数公式形式一致.
  • 变换后,变元只在小的一方有,从而可以使用 Newton 二项式.

Banach 火柴盒问题

例题:Banach 火柴盒问题

数学家的左右衣袋当中各放有一盒装有 \(N\) 根火柴的火柴盒,每次抽烟的时候任取一盒用一根,求发现一盒用光的时候,另一盒有 \(r\) 根的概率.

看作 \(p=\dfrac{1}{2}\) 的 Bernoulli 试验,要左边空而右边剩下 \(r\) 根,应该要左边摸过 \(N+1\) 次(最后一次用来发觉火柴盒是空的),右边摸过 \(N-r\) 次,因此这个事件的概率为:

\[ f\left(2N-r+1 ; N+1, \frac{1}{2}\right) = \binom{2N-r+1}{N+1} \frac{1}{2^{2N-r+1}} \]

由于甲乙对称,所以所求的概率乘 \(2\) 即可:

\[ \binom{2N-r+1}{N+1} \frac{1}{2^{2N-r}} \]

\(\square\)

有关本题

本题起源实际上是为了取笑 Banach 抽烟较多而出现的,所以需要最后一次来发现火柴盒空了估计也是取笑吧……

直线上的随机游动

无限制随机游动

考虑 \(x\) 轴上的一个点,它只能位于整数点,初始位置为 \(a\) ,每隔单位时间,它总是随机向正或负方向移动一个单位长度,分别为概率 \(p\)\(q=1-p\) .

假定从时刻 \(0\) 开始从原点出发,以 \(S_n\) 记它在时刻 \(t=n\) 的位置,为了使得质点在 \(t=n\) 的时候位于 \(k\) ,必须而且只需在前 \(n\) 次随机游动中向右的次数比向左的次数多 \(k\) 次.

\(x\) 为向右的次数,\(y\) 为向左的次数,则

\[ \begin{cases} x+y = n \\ x-y = k \end{cases} \]

因此可以知道事件 \(\left\lbrace S_n=k \right\rbrace\) 发生的概率需要在前 \(n\) 次游动当中有 \(\frac{n+k}{2}\) 次向右,剩余向左:

\[ P(S_n = k) = \left(\begin{array}{c} n\\ \dfrac{n+k}{2} \end{array}\right) q^{\frac{n-k}{2}}p^{\frac{n+k}{2}} \]

带有吸收壁的随机游动

假定在时刻 \(0\) 时,位于 \(x=a\) ,而在 \(x=0\)\(x=a+b\) 处各有一个吸收壁,我们来求质点在 \(x=0\)\(x=a+b\) 处被吸收的概率.

\(q_n\) 记质点的初始位置为 \(n\) 而最终在 \(a+b\) 点被吸收的概率,显然

\[ q_0 = 0, q_{a+b} = 1 \]

一般而言,对于位置 \(n\) ,从其他位置到位置 \(n\) 的时候,实际上概率也就会变成 \(q_n\) ,到位置 \(n\) 只有两种情形:

  • \(n+1\) 向左到 \(n\)
  • \(n-1\) 向右到 \(n\) .

那么根据全概率公式有:

\[ q_n = pq_{n+1}+qq_{n-1} \]

这是一个二阶差分方程,将其转化为一个二阶递推数列的问题:

\[ p(q_{n+1}-q_n) = q(q_n-q_{n-1}) \]

\(c_n = q_{n+1}-q_n\)\(r = \dfrac{q}{p}\)

\[ c_n = rc_{n-1} \]

如果 \(r=1\) ,那么此时有

\[ q_n = q_0+n(q_1-q_0) \]

故可得

\[ q_n = \frac{n}{a+b} \]

如果 \(r \neq 1\) ,那么根据等比数列公式有

\[ q_n = \dfrac{1-r^n}{1-r^{a+b}} \]

当然,利用特征方程实际上更简单.

多项分布

\(n\) 次独立重复试验,每次结果出现若干个结果的情形得到的概率分布为多项分布,把每次试验的结果记为 \(A_1,A_2,\cdots,A_r\) ,而 \(P(A_i) = p_i\) ,且

\[ \sum\limits_{k=1}^r p_k =1 \]

那么可以导出,对 \(A_i\) 出现 \(k_i\) 次的情形,概率为:

\[ \frac{n!}{k_1!k_2!\cdots k_r!} p_1^{k_1}\cdots p_r^{k_r} \]

这个公式称为多项分布,它是二项分布的推广.

评论