一维连续型随机变量
如果对于随机变量 X 的分布函数 F ( x ) ,存在非负函数 f ( x ) ,使得对于任意实数 x ,有
F ( x ) = ∫ − ∞ x f ( t ) d t
则称 X 为连续型随机变量 ,其中函数 f ( x ) 称为 X 的概率密度函数 (Probability Density Function, pdf ),F ( x ) 称为累积分布函数 (Cumulative Distribution Function, cdf )。
概率密度函数
概率密度函数 f ( x ) 描述了随机变量在某一点附近取值的概率密度。
性质
非负性 : f ( x ) ≥ 0 .
归一性 : ∫ − ∞ + ∞ f ( x ) d x = 1 .
对于任意实数 x 1 , x 2 (x 1 < x 2 ),
P { x 1 < X ≤ x 2 } = ∫ x 1 x 2 f ( x ) d x = F ( x 2 ) − F ( x 1 )
对连续型随机变量而言,其在任意一点取值的概率为 0 ,即 P { X = a } = 0 。因此
P { x 1 < X ≤ x 2 } = P { x 1 ≤ X ≤ x 2 } = P { x 1 < X < x 2 } = P { x 1 ≤ X < x 2 }
若 f ( x ) 在点 x 处连续,则有 F ′ ( x ) = f ( x ) 。
分布
均匀分布
若连续型随机变量 X 在区间 ( a , b ) 上服从均匀分布 ,记为 X ∼ U ( a , b ) 。
概率密度函数 :
f ( x ) = { b − a 1 , 0 , a < x < b 其他
累积分布函数 :
F ( x ) = ⎩ ⎨ ⎧ 0 , b − a x − a , 1 , x ≤ a a < x ≤ b x > b
指数分布
若连续型随机变量 X 服从指数分布 ,记为 X ∼ E ( λ ) ,其中参数 λ > 0 。
概率密度函数 :
f ( x ) = { λ e − λ x , 0 , x > 0 x ≤ 0
累积分布函数 :
F ( x ) = { 1 − e − λ x , 0 , x > 0 x ≤ 0
无记忆性
指数分布是连续型随机变量中唯一具有无记忆性 的分布。其数学表达为:对于任意 s , t > 0 ,
P ( X > s + t ∣ X > s ) = P ( X > t )
证明 :
根据条件概率的定义,
P ( X > s + t ∣ X > s ) = P ( X > s ) P ({ X > s + t } ∩ { X > s })
因为事件 { X > s + t } 必然包含在事件 { X > s } 中,所以它们的交集就是 { X > s + t } 。
P ( X > s + t ∣ X > s ) = P ( X > s ) P ( X > s + t )
对于服从参数为 λ 的指数分布的随机变量 X ,其生存函数为 P ( X > x ) = 1 − F ( x ) = e − λ x (x > 0 )。因此,
P ( X > s ) P ( X > s + t ) = e − λ s e − λ ( s + t ) = e − λ s e − λ s e − λ t = e − λ t = P ( X > t )
直观解释 :
参数 λ 代表失效率 ,指数分布往往用来描述一个事物首次发生某个事件(如损坏、失效)前等待的时间。例如,一个元件的寿命 X 服从指数分布。无记忆性 意味着,如果这个元件已经使用了 s 小时,那么它还能继续使用超过 t 小时的概率,与一个全新的元件能使用超过 t 小时的概率是完全相同的。也就是说,元件的“寿命”不会因为已经使用过一段时间而“老化”,它“忘记”了自己已经工作了多久。
正态分布
若连续型随机变量 X 服从正态分布 (或高斯分布 ),记为 X ∼ N ( μ , σ 2 ) ,其中 μ 为均值,σ 2 为方差。
概率密度函数 :
f ( x ) = 2 π σ 1 e − 2 σ 2 ( x − μ ) 2 , ( − ∞ < x < + ∞ )
f ( x ) 的图形关于直线 x = μ 对称。
在 x = μ 处取得唯一极值点 (最大值):f ( μ ) = 2 π σ 1 。
在 x = μ ± σ 处有拐点 。
累积分布函数 :
F ( x ) = ∫ − ∞ x 2 π σ 1 e − 2 σ 2 ( t − μ ) 2 d t
当 μ = 0 , σ = 1 时,称为标准正态分布 ,记为 Z ∼ N ( 0 , 1 ) 。
标准正态分布的密度函数用 φ ( x ) 表示:φ ( x ) = 2 π 1 e − 2 x 2 。
标准正态分布的分布函数用 Φ ( x ) 表示:Φ ( x ) = ∫ − ∞ x 2 π 1 e − 2 t 2 d t 。
Φ ( − x ) = 1 − Φ ( x ) 。
上 α 分位数 z α :满足 P ( Z > z α ) = α 的点,即 ∫ z α + ∞ φ ( x ) d x = α 或 1 − Φ ( z α ) = α 。
性质
标准化 :若 X ∼ N ( μ , σ 2 ) ,则 Z = σ X − μ ∼ N ( 0 , 1 ) 。于是,对于任意 x ,
P { X ≤ x } = P { σ X − μ ≤ σ x − μ } = Φ ( σ x − μ )
线性性质 :若 X ∼ N ( μ , σ 2 ) ,则 Y = a X + b (a = 0 ) 服从
Y ∼ N ( a μ + b , ( aσ ) 2 )
应用
例题
[问答题]
已知随机变量 X 的概率密度为
f ( x ) = ⎩ ⎨ ⎧ A x , B , 0 , 1 < x < 2 2 ≤ x < 3 其他
且 P { 1 < X < 2 } = P { 2 < X < 3 } ,求常数 A , B ,分布函数 F ( x ) 以及概率 P { 2 < X < 4 } 。
[答案]
解 :
求常数 A, B
由概率密度函数的归一性 可得:
∫ − ∞ + ∞ f ( x ) d x = ∫ 1 2 A x d x + ∫ 2 3 B d x = 1 [ 2 A x 2 ] 1 2 + [ B x ] 2 3 = 2 A ( 4 − 1 ) + B ( 3 − 2 ) = 2 3 A + B = 1
又根据已知条件 P { 1 < X < 2 } = P { 2 < X < 3 } ,有:
∫ 1 2 A x d x = ∫ 2 3 B d x 2 3 A = B
联立求解方程组:
{ 2 3 A + B = 1 2 3 A = B
得 B + B = 1 ⟹ 2 B = 1 ,所以 B = 2 1 。
代入得 2 3 A = 2 1 ,所以 A = 3 1 。
求分布函数 F(x)
已求得概率密度为:
f ( x ) = ⎩ ⎨ ⎧ 3 1 x , 2 1 , 0 , 1 < x < 2 2 ≤ x < 3 其他
根据定义 F ( x ) = ∫ − ∞ x f ( t ) d t 分段计算:
当 x ≤ 1 时,F ( x ) = ∫ − ∞ x 0 d t = 0 。
当 1 < x < 2 时,F ( x ) = ∫ 1 x 3 1 t d t = [ 6 1 t 2 ] 1 x = 6 x 2 − 6 1 。
当 2 ≤ x < 3 时,F ( x ) = ∫ 1 2 3 1 t d t + ∫ 2 x 2 1 d t = ( 6 2 2 − 6 1 ) + [ 2 1 t ] 2 x = 2 1 + ( 2 x − 1 ) = 2 x − 2 1 。
当 x ≥ 3 时,F ( x ) = ∫ 1 2 3 1 t d t + ∫ 2 3 2 1 d t = 2 1 + 2 1 = 1 。
综上,分布函数为:
F ( x ) = ⎩ ⎨ ⎧ 0 , 6 x 2 − 1 , 2 x − 1 , 1 , x ≤ 1 1 < x < 2 2 ≤ x < 3 x ≥ 3
求概率 P{2 < X < 4}
方法一:利用概率密度函数
P { 2 < X < 4 } = ∫ 2 4 f ( x ) d x = ∫ 2 3 2 1 d x + ∫ 3 4 0 d x = [ 2 1 x ] 2 3 = 2 3 − 2 2 = 2 1
方法二:利用分布函数
P { 2 < X < 4 } = F ( 4 ) − F ( 2 ) = 1 − 2 2 − 1 = 1 − 2 1 = 2 1