中心极限定理
核心思想:无论原始随机变量 服从何种分布(只要其期望 和方差 存在),当样本量 足够大时,其和 的分布近似为正态分布。
- 和的近似分布:
- 均值的近似分布:
在实际应用中,一般认为当 时,即可使用中心极限定理进行近似计算。
列维 - 林德伯格定理
定义
设随机变量序列 独立同分布 (i.i.d.),且其数学期望和方差均存在:
记变量之和为 ,则 的标准化变量为:
当 时, 的分布函数 收敛于标准正态分布的分布函数 :
其中,
我们称 依分布收敛于标准正态分布 ,记为 。
已知手套是使用寿命服从指数分布,单位为小时,且平均寿命为 小时。若一个人需要带手套进行工作,发现手套坏了就立刻换新继续工作,为保证该工人有 的把握能工作 小时,求应该为其准备手套的副数
解: 设第 副手套的使用寿命为 。根据题意, 相互独立且服从同一指数分布。 其平均寿命为 小时,对于指数分布,期望 。 指数分布的方差为 。 设需要准备 副手套,总工作时长为 。根据列维 - 林德伯格定理,当 足够大时, 近似服从正态分布: 问题要求保证有 的把握工作 小时,即总寿命不小于 的概率为 。 对变量进行标准化处理:
其中 。
由标准正态分布的性质可知,。
查标准正态分布表,可知 。因此:
因为手套副数 必须为整数,所以应取 。
故应为其准备 118 副手套。
棣莫弗 - 拉普拉斯定理
棣莫弗 - 拉普拉斯定理 是中心极限定理的早期版本,特指二项分布 以正态分布为极限分布的情况。
定义
设随机变量 服从参数为 的二项分布,记为 ,其中 。则对于任意实数 ,有:
这表明,当 足够大时,可以利用正态分布来近似计算二项分布的概率。
注意:
由于二项分布是离散型分布,而正态分布是连续型分布,在用连续分布近似离散分布时,为了提高精度,通常需要进行连续性校正 (continuity correction)。
- 近似为
- 近似为
- 即 ,近似为
其中 。
例题
生产线生产的产品成箱包装,每箱质量是随机的。假设每箱平均质量 千克,标准差为 千克。若用载重为 吨的汽车承运,试用中心极限定理说明每辆汽车最多可以装多少箱才能保证不超载的概率大于 。(已知 )
设 X_i 为第 i 箱产品的质量,则 X_i 独立同分布。 根据题意,E(X_i) = \mu = 50,标准差 \sigma = 5,所以方差 D(X_i) = \sigma^2 = 25。 设一辆汽车装载 n 箱产品,总质量为 T_n = \sum_{i=1}^n X_i。 则总质量的期望和方差为: E(T_n) = n\mu = 50n D(T_n) = n\sigma^2 = 25n 根据中心极限定理,T_n 近似服从正态分布 N(50n, 25n)。 汽车载重为 5 吨,即 5000 千克。要保证不超载的概率大于 0.977,即: P(T_n \le 5000) > 0.977 对变量进行标准化: P\left(\frac{T_n - 50n}{\sqrt{25n}} \le \frac{5000 - 50n}{\sqrt{25n}}\right) > 0.977 \Phi\left(\frac{5000 - 50n}{5\sqrt{n}}\right) > 0.977 已知 \Phi(2) = 0.977,且 \Phi(x) 是单调递增函数,所以: \frac{5000 - 50n}{5\sqrt{n}} > 2 即 n < (9.90)^2 \approx 98.01 因为箱数 n 必须是整数,所以 n 的最大取值为 98。 即每辆汽车最多可以装 箱。