切比雪夫不等式
切比雪夫不等式(Chebyshev’s Inequality)给出了在随机变量的分布未知的情况下,利用其期望和方差来估计概率的一个上界。
定理
设随机变量 X 的数学期望 E(X)=μ,方差 D(X)=σ2 均存在。则对任意正数 ϵ,有
P{∣X−μ∣≥ϵ}≤ϵ2σ2
或者等价地
P{∣X−μ∣<ϵ}≥1−ϵ2σ2
说明:该不等式表明,一个随机变量偏离其期望值超过 ϵ 的概率,受制于其方差和 ϵ 的大小。方差越小,该概率就越小。它适用于任何分布的随机变量(只要期望和方差存在),但其估计通常比较粗略。
证明(以连续型为例)
根据方差定义:
σ2=D(X)=∫−∞+∞(x−μ)2f(x)dx
将积分区域拆分为 ∣x−μ∣≥ϵ 和 ∣x−μ∣<ϵ:
σ2=∫∣x−μ∣≥ϵ(x−μ)2f(x)dx+∫∣x−μ∣<ϵ(x−μ)2f(x)dx
由于第二项非负,则有:
σ2≥∫∣x−μ∣≥ϵ(x−μ)2f(x)dx
在积分区域 ∣x−μ∣≥ϵ 中,被积函数满足 (x−μ)2≥ϵ2,因此:
σ2≥∫∣x−μ∣≥ϵϵ2f(x)dx=ϵ2∫∣x−μ∣≥ϵf(x)dx
而积分 ∫∣x−μ∣≥ϵf(x)dx 正是事件 {∣X−μ∣≥ϵ} 的概率 P{∣X−μ∣≥ϵ}。
所以,
σ2≥ϵ2P{∣X−μ∣≥ϵ}
移项即得:
P{∣X−μ∣≥ϵ}≤ϵ2σ2