Bernoulli 试验与直线上的随机游动
Bernoulli 试验与二项分布
Bernoulli 试验的定义
定义
将事件域取为 \(\mathscr{F}= \left\lbrace \varnothing,A,\overline{A} \right\rbrace\) ,称 \(A\) 出现为成功,\(\overline{A}\) 出现为失败,则这种只有两个可能结果的试验称为 Bernoulli 试验.
进行重复 \(n\) 次独立的 Bernoulli 试验,这里的重复是指每次 \(A\) 的概率保持不变,这种试验称为 \(n\) 重 Bernoulli 试验. 它有以下四个约定:
- 每次试验至多出现两个可能结果之一:\(A\) 或 \(\overline{A}\) .
- \(A\) 在每次试验中出现的概率 \(p\) 保持不变.
- 每次试验相互独立. (这是非常重要的一点)
- 共进行 \(n\) 次试验.
其样本点形如:
Bernoulli 试验的概率计算
设样本点当中有 \(k\) 个 \(A\) ,\(n-k\) 个 \(\overline{A}\) ,那么有
并且这样的情形总共有 \(\binom{n}{k}\) 种,因此对于从 \(n\) 个中取 \(k\) 次成功的概率为:
有放回抽样
有放回抽样
若在 \(N\) 件产品当中有 \(M\) 件废品,现在进行 \(n\) 次有放回的抽样检查,共抽到 \(k\) 件废品的概率是多少?
直接利用 \(n\) 重 Bernoulli 试验即可:
\(\square\)
二项分布
对 Bernoulli 试验的概率进行考察,可以注意到 \(b(k;n,p)\) 是二项式 \((q+ps)^n\) 中 \(s^n\) 的展开系数,因此 \(b(k;n,p)\) 也称为二项分布.
需要验证概率之和为 \(1\) :
几何分布
现在讨论在 Bernoulli 试验当中首次成功出现在第 \(k\) 次试验的概率,要使首次成功出现在第 \(k\) 次试验,必须而且只需在前 \(k-1\) 次试验中都出现事件 \(\overline{A}\) .
利用试验独立性有:
从而
验证求和为 \(1\) :
Pascal 分布
Pascal 分布的定义与性质
考虑 Bernoulli 试验要多长时间才会出现第 \(r\) 次成功.
记 \(C_k\) 为第 \(r\) 次成功发生在第 \(k\) 次试验这一事件当中,并且以 \(f(k;r,p)\) 来记录这个概率.
\(C_k\) 发生当且仅当前面的 \(k-1\) 次试验中有 \(r-1\) 次成功,\(k-r\) 次失败,从而有:
那么现在就有
现在问题来了,我们如何证明其求和为 \(1\) ?
这里面其实用到了一些求和的通法:
- 首先观察组合数,我们发现变元在较大的一方,我们作变换:
- 先用 \(k=l+r\) 换为我们相对好变换的形式;
- 使上下均有变元,我们发现其形式和古典概型一章中学到的推广组合数公式形式一致.
- 变换后,变元只在小的一方有,从而可以使用 Newton 二项式.
Banach 火柴盒问题
例题:Banach 火柴盒问题
数学家的左右衣袋当中各放有一盒装有 \(N\) 根火柴的火柴盒,每次抽烟的时候任取一盒用一根,求发现一盒用光的时候,另一盒有 \(r\) 根的概率.
看作 \(p=\dfrac{1}{2}\) 的 Bernoulli 试验,要左边空而右边剩下 \(r\) 根,应该要左边摸过 \(N+1\) 次(最后一次用来发觉火柴盒是空的),右边摸过 \(N-r\) 次,因此这个事件的概率为:
由于甲乙对称,所以所求的概率乘 \(2\) 即可:
\(\square\)
有关本题
本题起源实际上是为了取笑 Banach 抽烟较多而出现的,所以需要最后一次来发现火柴盒空了估计也是取笑吧……
直线上的随机游动
无限制随机游动
考虑 \(x\) 轴上的一个点,它只能位于整数点,初始位置为 \(a\) ,每隔单位时间,它总是随机向正或负方向移动一个单位长度,分别为概率 \(p\) 和 \(q=1-p\) .
假定从时刻 \(0\) 开始从原点出发,以 \(S_n\) 记它在时刻 \(t=n\) 的位置,为了使得质点在 \(t=n\) 的时候位于 \(k\) ,必须而且只需在前 \(n\) 次随机游动中向右的次数比向左的次数多 \(k\) 次.
设 \(x\) 为向右的次数,\(y\) 为向左的次数,则
因此可以知道事件 \(\left\lbrace S_n=k \right\rbrace\) 发生的概率需要在前 \(n\) 次游动当中有 \(\frac{n+k}{2}\) 次向右,剩余向左:
带有吸收壁的随机游动
假定在时刻 \(0\) 时,位于 \(x=a\) ,而在 \(x=0\) 和 \(x=a+b\) 处各有一个吸收壁,我们来求质点在 \(x=0\) 和 \(x=a+b\) 处被吸收的概率.
以 \(q_n\) 记质点的初始位置为 \(n\) 而最终在 \(a+b\) 点被吸收的概率,显然
一般而言,对于位置 \(n\) ,从其他位置到位置 \(n\) 的时候,实际上概率也就会变成 \(q_n\) ,到位置 \(n\) 只有两种情形:
- 从 \(n+1\) 向左到 \(n\) ;
- 从 \(n-1\) 向右到 \(n\) .
那么根据全概率公式有:
这是一个二阶差分方程,将其转化为一个二阶递推数列的问题:
记 \(c_n = q_{n+1}-q_n\) 且 \(r = \dfrac{q}{p}\) :
如果 \(r=1\) ,那么此时有
故可得
如果 \(r \neq 1\) ,那么根据等比数列公式有
当然,利用特征方程实际上更简单.
多项分布
\(n\) 次独立重复试验,每次结果出现若干个结果的情形得到的概率分布为多项分布,把每次试验的结果记为 \(A_1,A_2,\cdots,A_r\) ,而 \(P(A_i) = p_i\) ,且
那么可以导出,对 \(A_i\) 出现 \(k_i\) 次的情形,概率为:
这个公式称为多项分布,它是二项分布的推广.