《概率、统计与随机过程》笔记第 1 章概率论导论

Notes 概率论

Lastmod: 2020-10-26 周一 18:08:53

第 1 章概率论导论

1.2 概率的不同类型

直观概率：基于直观来处理判断

古典概率：事件概率不是实验性的，通过预先计算事件 $E$ 可能发生的次数 $n_E$ 形成一个比值 $n_E / n$ 其中 $n$ 是所有可能的结果。此时需要所有的结果是等可能的。

古典概率不能处理实验结果不是等可能的情况，不能处理实验结果是无穷大的情况。

频率作为概率的测度：

$$P[E] = \lim_{n \to \infty} \frac{n_E}{n}$$

但注意到 $n$ 不可能是无穷大，因此引入基于公理化理论的概率。

1.4 集合、域和事件

样本空间：所有实验结果的集合 $\Omega$

事件：样本空间的子集

单一实验结果：$\zeta$

$\Omega$ 本身也称必然事件，空集 $\phi$ 也称零事件。

如果 $\Omega = \lbrace \zeta_{1},\zeta_{1},\dots,\zeta_{N} \rbrace$ 则其子集有 $2^N$ 个。

德摩根（De Morgan）定律：

$$\complement_{U}\left[\bigcup_{i=1}^{n} E_i\right] = \bigcap_{i=1}^{n} \complement_{U} E_i$$ $$\complement_{U}\left[\bigcap_{i=1}^{n} E_i\right] = \bigcup_{i=1}^{n} \complement_{U} E_i$$

$\sigma$ 域：考虑一个全集 $\Omega$ 和 $\Omega$ 的子集构成的集合簇，另 $E$ 和 $F$ 是这个簇中的任意两个子集，如果

(1) $\phi \in \mathscr{M}$ ，$\Omega \in \mathscr{M}$

(2) 如果 $E \in \mathscr{M}$ 和 $F \in \mathscr{M}$，那么 $E \cup F \in \mathscr{M}$ 和 $E \cap F \in \mathscr{M}$

(3) 如果 $E \in \mathscr{M}$ ，则 $\complement_{\Omega} E \in \mathscr{M}$

则该集合簇形成了一个域 $\mathscr{M}$。

当 $\Omega$ 是不可数的，并非每个子集都能以一致的方式赋予概率（可测的），必须使用较小的集合簇来形成 $\sigma$ 域。比如当 $\Omega = R^1$ 即实数直线时，并非 $\Omega$ 的每个子集都能以一致的方式赋予概率（可测的）。我们可以从所有的开或闭区间生成一个 $\sigma$ 域，即实数直线上的事件的博雷尔（Borel）域，这个域包含了所有感兴趣的工程和科学中的子集。

1.5 概率的公理化定义

概率是一个集合函数 $P[\ \cdot \ ]$ 它对每个事件 $E \in \scr{F}$ 指定一个数 $P[E]$，这个数称为事件 $E$ 的概率，它满足：

(1) $P[E] \ge 0$

(2) $P[\Omega] = 1$

(3) $P[E \cup F] = P[E] + P[F]$ 如果 $E \cap F = \phi$

一些推论

(4) $P[\phi] = 0$

(5) $P[E \cap \left(\complement_{\Omega} F \right)] = P[E] - P[EF]$

(6) $P[E] = 1 - P[\complement_{\Omega} E]$

(7) $P[E \cup F] = P[E] + P[F] - P[EF]$

(8) $P \left[ \cup_{i=1}^{n} E_i \right] = \sum_{i=1}^{n} P[E_i]$ 如果 $\forall \ i \ne j, E_i E_j = \phi$

(9) $P \left[ \cup_{i=1}^{n} E_i \right] \le \sum_{i=1}^{n} P[E_i]$

在一给定实验中，事件 $E_1, E_2, \cdots, E_n$ 至少有一个发生的概率可以用容斥原理来求。

1.6 联合概率、条件概率、全概率和独立性

联合概率：多个事件同时发生的概率。如 $P[AB]$

条件概率：某事件 $A$ 已经发生时 $B$ 发生的概率。

$$P[B|A] = \frac{P[AB]}{P[A]}$$

事件独立：如果 $A \in \scr{F}$，$B \in \scr{F}$，且 $P[A] > 0$，$P[B]>0$，当且仅当 $P[AB] = P[A]P[B]$ 时，称事件 $A$ 和 $B$ 是独立的。

一般的，对于独立事件 $P[A|B] = P[A]$，$P[B|A]=P[B]$

联合独立：令 $A_i(i=1,\cdots,n) \in \scr{F}$ 当且仅当

$P[A_i A_j] = P[A_i] P[A_j]$

$P[A_i A_j A_k] = P[A_i] P[A_j] P[A_k]$

$\vdots$

$P[A_1 \cdots A_n] = P[A_1] \cdots P[A_n]$

对所有下标 $1\le i < j < k < \cdots \le n$ 成立时，我们说所有的 $A_i$ 是联合独立。

独立实验：一个实验的结果不受另一个的过去、现在和将来的实验结果的影响。

对于两个实验，如果：

(1) 对于互积事件 $E = E_1 E_2$，我们能够写成

$$P[E] = P_1[E_1] P_2[E_2]$$

(2) 在复合实验中，一般事件 $E$ 的概率能够根据单一事件的概率来表示

$$P[E] = \sum_{(\zeta_1, \zeta_2) \in E} P_1[\{ \zeta_1 \}] P_2[\{ \zeta_2 \}]$$

则称两个实验是独立的。

推广到 $n$ 个实验的组合，则复合实验的样本空间为

$$\begin{align} \Omega =& \bigotimes_{i=1}^{n} \Omega_i \\ =& \Omega_1 \times \Omega_2 \times \cdots \times \Omega_n \end{align}$$

实验结果是一个 $n$ 维向量 $\zeta = (\zeta_1, \zeta_2, \cdots , \zeta_n) \in E \subseteq \Omega$。

事件是独立的，指对于复合实验中的任意事件 $E$

$$P[E] = \sum_{i=1}^{k} P_1[E_{1,i}] P_2[E_{2,i}] $$

其中 $E = \bigcup_{i=1}^{k} E_{1,i} \times E_{2,i}$，是一个互不相交的并集，因此概率具有可加性。

非独立实验：第二个实验的概率依赖于第一个实验发生的事件。第二个实验的概率测度需要添加与第一个实验结果相关的下标 $E_{2,i}$。此时对于复合事件 $E$，另 $E_1 = \cup_{i} {\zeta_{1,i}}$

$$P[E] = \sum_{i} P[{\zeta_{1,i}}] P_{2,i}[E_2]$$

全概率定理：

令 $A_1, A_2, \cdots, A_n$ 是 $n$ 个互斥的事件，且 $\bigcup_{i=1}^{n} A_i = \Omega$，令 $B$ 是任何一个定义在 $A_i$ 的概率空间上的事件，那么对于所有 $i$，$P[A_i] \neq 0$，有

$$P[B] = \sum_{i=1}^{n} P[B|A_i] P[A_i]$$

1.7 贝叶斯定理及其应用

贝叶斯定理(Bayes’ Theorem)：令 $A_i(i=1,2,\cdots,n)$ 是定义在概率空间 $\scr{P}$ 上的一个事件集合，且对于所有的 $i \neq j$，$\bigcup_{i=1}^{n} A_i = \Omega$ 且 $A_i A_j = \phi$。有一个定义在 $\scr{P}$ 上的事件 $B$，$P[B] > 0$ 和对所有 $i$，$P[A_i] \neq 0$，有

$$P[A_j|B] = \frac{P[B|A_j]P[A_j]}{\sum_{i=1}^{n} P[B|A_i] P[A_i]}$$

可以发现

$$\frac{P[B|A_j]P[A_j]}{\sum_{i=1}^{n} P[B|A_i] P[A_i]} = \frac{P[A_j B]}{P[B]}$$

1.8 组合

容量为 $r$ 的有序样本：$n$ 个元素 $a_1, a_2, \cdots, a_n$ 的任何有序排列 $a_{k_1}, a_{k_2}, \cdots, a_{k_r}$，其中每个 $k_i$ 可以是 $1$ 到 $n$ 的任意值。

重复抽样能够形成 $n^r$ 个不同的有序样本。

无重复抽样能够形成

$$(n)_r = \frac{n!}{(n-r)!} = C_n^r \cdot r!$$

对于组合数 $C_n^r$ 由于其也为二项式系数，也记作

$$C_n^r = \binom{n}{r}$$

由于 $n$ 个元素自己的数目是 $2^n$ 个，因此

$$\sum_{r=0}^{n} \binom{n}{r} = 2^n$$

把 $n$ 个元素集合划分成 $l$ 个大小为 $r_1, r_2, \cdots, r_l$ （$\sum_{i=1}^{l} r_i = n$）的不同集合的方案数有

$$\binom{n}{r_1}\binom{n-r_1}{r_2} \cdots \binom{n-r_1-r_2-\cdots - r_{l-1}}{r_l} = \frac{n!}{r_1! \cdot r_2! \cdots r_l!} = \binom{n}{r1 \ r2 \ \cdots \ r_l}$$

入住问题：$r$ 个球放入 $n$ 个盒子，

盒子可辩别，球可辩别，方案数为 $n^r$
盒子可辩别，球不可辩别。考虑隔板法，即在 $r$ 个球前后及之间的空隙插入 $n-1$ 个隔板。由于隔板和球都是不可区分的，而隔板和球的顺序可以是任意的，这相当于从 $n-1+r$ 个隔板或球中选出球或隔板，即：

$$\binom{n+r-1}{r} = \binom{n+r-1}{n-1}$$

盒子可辩别，球不可辩别，盒子不能为空。此时隔板之间必须有球，相当于直接向隔板之间的空隙插入球即可，即

$$\binom{r-1}{n-1}$$

生日碰撞：

记一年天数为 $n$，一个组中有 $r$ 个人，用 $P_0(r,n)$ 表示一组中没有人生日相同的概率，则

$$P_0(r,n) = \frac{n(n-1)(n-2)\cdots(n-r+1)}{n^r} = \prod_{i=1}^{r-1} (1-\frac{i}{n})$$

1.9 伯努利试验（Bernoulli Trials）：二项式和多项式的概率分布

伯努利试验（Bernoulli Trials）：只有成功 $s$ 失败 $f$ 两种可能，有 $P[s] = p,P[f]=q$，其中 $0<p<1,q=1-p$

假定该试验做了 $n$ 次，则样本空间为：

$$\Omega_n = {a_1,\cdots, a_M}$$

其中 $M=2^n$，$a_i$ 是一个有序的 $n$ 元组。

$n$ 试验 $k$ 次成功的概率，即二项式概率分布律

$$b(k;n,p) = \binom{n}{k} p^k q^{n-k}$$

$n$ 试验小于等于 $k$ 次成功的概率，即二项式分布函数

$$B(k;n,p) = \sum_{i=0}^{k} b(i;n,p) = \sum_{i=0}^{k} \binom{n}{k} p^i q^{n-i}$$

多项式概率分布

多项式概率分布是二项式概率分布的推广。假设某次试验有 $l$ 个结果，对应结果 $\zeta_i$ 的概率为 $p_i$，那么有，$p_i \ge 0, \sum_{i=1}^{l} p_i = 1$

$n$ 次试验结果构成一个 $n$ 长的有序串，其中 $\zeta_i$ 出现 $r_i$ 次，则此实验结果出现的概率为

$$\prod_{i=1}^{n} p_i^{r_i}$$

如果忽略结果的有序性，只在乎每种 $\zeta_i$ 的出现次数为 $r_i$ 次，则概率为

$$\binom{n}{r1 \ r2 \ \cdots \ r_l}\prod_{i=1}^{n} p_i^{r_i}$$

1.10 二项式概率分布的渐进特性：泊松分布（Poisson Law）

假定二项式函数 $b(k;n,p)$ 中 $n \gg 1, p \ll 1$，但 $np = \mu$ 保持一个常数，则

$$b(k;n,p) = \binom{n}{k} p^k q^{n-k} \approx \frac{1}{k!} \mu^k \left(1-\frac{\mu}{n} \right)^{n-k}$$

当 $n \rightarrow \infty$ 时，

$$\frac{1}{k!} \mu^k (1-\frac{\mu}{n})^{n-k} \rightarrow \frac{\mu^k}{k!} e^{-\mu}$$

参数为 $\mu > 0$ 的泊松分布为

$$\frac{\mu^k}{k!} e^{-\mu}, \quad 0 \le k < \infty$$

1.11 二项式分布近似为正态分布

定义 $f_{SN}(x)$ 为标准正态分布，

$$f_{SN}(x) = \frac{1}{\sqrt{2\pi}} \exp \left(-\frac{1}{2}x^2 \right) $$

当 $n$ 很大时，尤其是 $npq \gg 1$ 时，

$$b(k;n,p) \approx \frac{1}{\sqrt{npq}} f_{SN} \left(\frac{k-np}{\sqrt{npq}} \right) $$

Prev: 《Effective C++》笔记 1. 让自己习惯 C++
Next: 《C++ Primer》拾遗第 1 章开始

第 1 章 概率论导论