一维随机变量函数的分布
设 X 为随机变量,函数 y=g(x),则以随机变量 X 作为自变量的函数 Y=g(X) 也是随机变量,称为随机变量 X 的函数。
如 Y=aX2+bX+c 等等
离散型
设离散型随机变量 X 的分布律为:
P{X=xi}=pi,(i=1,2,…)
则 Y=g(X) 也是一个离散型随机变量。其可能的取值为 yi=g(xi)。
Y 的分布律为:
P{Y=yj}=P{g(X)=yj}=∑g(xi)=yjP{X=xi}
核心方法:将 Y 的取值 yj 相同的项合并,将对应的概率 pi 相加,作为 Y 取值为 yj 的概率。
例题
[问答题]
设 X 的分布律为
| X | -2 | -1 | 0 | 1 | 2 | 3 |
|---|
| P | 0.05 | 0.15 | 0.20 | 0.25 | 0.20 | 0.15 |
求 Y=2X+1 和 Z=X2 的分布律。
[答案]
解:
- 求 Y=2X+1 的分布律:
g(x)=2x+1 是一个一一映射, X 的不同取值对应 Y 的不同取值。因此, Y 的取值所对应的概率与 X 相同。
X 取 −2,−1,0,1,2,3 时, Y 对应取值为 −3,−1,1,3,5,7。
Y 的分布律为:
| Y | -3 | -1 | 1 | 3 | 5 | 7 |
|---|
| P | 0.05 | 0.15 | 0.20 | 0.25 | 0.20 | 0.15 |
- 求 Z=X2 的分布律:
g(x)=x2 不是一一映射, X 的不同取值可能对应 Z 的相同取值。
X 取 −2,−1,0,1,2,3 时, Z 对应取值为 4,1,0,1,4,9。
Z 的所有可能取值为 0,1,4,9。
- P{Z=0}=P{X=0}=0.20
- P{Z=1}=P{X=−1}+P{X=1}=0.15+0.25=0.40
- P{Z=4}=P{X=−2}+P{X=2}=0.05+0.20=0.25
- P{Z=9}=P{X=3}=0.15Z 的分布律为:
连续型
给定连续型随机变量X,其分布函数 FX(x) 与密度 fX(x) 已知;设 Y=g(X)。求 Y 的分布常用两法:分布函数法与公式法(密度变换法)。
分布函数法
思路:直接由定义求 FY(y)=P(Y≤y)=P(g(X)≤y),再对 y 求导得 fY(y)。
步骤:
-
明确 X 的取值集 SX 与 Y 的取值集 SY=g(SX)。
-
对给定 y,解不等式 g(x)≤y 在 SX 中的解集 Ay。
-
由
FY(y)=P(X∈Ay)=∫AyfX(x)dx
得 FY(y);若需密度,作导数 fY(y)=dydFY(y)(存在处)。
典型情形:
快速例子:
- 若 X∼U(0,1),Y=X2,则 SY=[0,1],
FY(y)=P(X≤y)=y, 0≤y≤1;fY(y)=2y1, 0<y<1.
- 若 X∼N(0,1),Y=∣X∣,则 SY=[0,∞),
FY(y)=P(−y≤X≤y)=2Φ(y)−1, y≥0;fY(y)=2φ(y), y>0.
要点与注意:
- 先判定 SY=g(SX);边界点处可用极限求 FY。
- X 连续则 FX 连续,单调情形下 FY 公式可直接用上式(无需左极限)。
- 如 g 在一段上为常数且 P(X落于该段)>0,则 Y 在相应点出现原子(离散概率);此时 Y 非纯连续型。
公式法
当 g 可微且(在根附近)分段单调时,Y 的密度可由根的贡献求和。设对给定 y,方程 g(x)=y 在 SX 内有有限个解 xk(y),且这些解满足 g′(xk(y))=0,则
fY(y)=k∑∣g′(xk(y))∣fX(xk(y)),y∈SY.
等价地,在每个单调分支 Ik 上,若 hk=g−1∣g(Ik),则
fY(y)=k∑fX(hk(y))hk′(y),y∈g(Ik),
并在 SY 外取 fY(y)=0。
常用变换速记:
- 线性变换 Y=aX+b(a=0):
fY(y)=∣a∣1fX(ay−b),SY=b+aSX.
- 平方 Y=X2:
fY(y)=2yfX(y)+fX(−y), y>0;SY={y≥0: ±y∈SX}.
- 绝对值 Y=∣X∣:
fY(y)=fX(y)+fX(−y), y>0;FY(y)=P(−y≤X≤y).
- 倒数 Y=X1(要求 P(X=0)=0):
fY(y)=y21fX(y1), y∈{x1:x∈SX∖{0}}.
解题范式(公式法):
- 定 SX 并找 SY=g(SX)。
- 对一般 y∈SY,求解 g(x)=y 在 SX 内的全部解 xk(y)。
- 检查各解的可微性与 g′(xk)=0;应用
fY(y)=k∑∣g′(xk(y))∣fX(xk(y)).
- 必要时补充边界点的极限处理;核验 ∫SYfY(y)dy=1。
注意:
- 若某些 y 对应的解集包含使 g′(x)=0 的孤立点,通常对整体积分无影响,但需用极限求值,避免直接代入。
- 若 g 在 SX 上存在平坦区(常值区间)且有正概率,则 Y 含离散部分,上述密度公式仅覆盖其连续部分,需另加点质量:P(Y=c)=P(X∈{x:g(x)=c}).
例题
问题:设随机变量 X 服从参数为 λ 的指数分布,即 X∼E(λ),记 Y=max(X,1/X),求 Y 的分布函数 FY(y)。
解答:
第一步:分析函数与定义域
-
X 的概率密度函数为:
fX(x)={λe−λx,0,x>0x≤0
X 的取值范围(支撑集)为 SX=(0,∞)。
-
令 Y=g(X)=max(X,1/X)。我们分析函数 g(x):
g(x)=max(x,1/x)={1/x,x,0<x≤1x>1
当 x 在 (0,∞) 变化时,g(x) 的最小值为 g(1)=1。因此,Y 的取值范围为 SY=[1,∞)。对于 y<1, fY(y)=0 且 FY(y)=0。
第二步:用公式法求密度函数 fY(y)
我们考虑任意 y>1。根据公式法,需要解方程 g(x)=y。
max(x,1/x)=y
该方程有两个分支:
- 若 x>1,则 x=y,解为 x1=y。
- 若 0<x≤1,则 1/x=y,解为 x2=1/y。
对于 y>1,我们得到了两个在 SX=(0,∞) 内的解:x1=y 和 x2=1/y。
接下来计算 g′(x) 在两个解处的值:
- 对于 x1=y>1,我们使用 g(x)=x 这一分支,其导数 g′(x)=1。所以,∣g′(x1)∣=∣g′(y)∣=1。
- 对于 x2=1/y∈(0,1),我们使用 g(x)=1/x 这一分支,其导数 g′(x)=−1/x2。所以,∣g′(x2)∣=∣g′(1/y)∣=∣−1/(1/y)2∣=∣−y2∣=y2。
根据公式,对于 y>1,Y 的密度函数为:
fY(y)=∣g′(x1)∣fX(x1)+∣g′(x2)∣fX(x2)=1fX(y)+y2fX(1/y)=λe−λy+y2λe−λ/y
综上,Y 的密度函数为:
fY(y)={λe−λy+λy−2e−λ/y,0,y≥1y<1
第三步:积分求分布函数 FY(y)
Y 的分布函数 FY(y)=P(Y≤y)。
第四步:总结
综上所述,Y=max(X,1/X) 的分布函数为:
FY(y)={0,e−λ/y−e−λy,y<1y≥1
注记:本题使用分布函数法求解会更加快捷。
对于 y≥1:
FY(y)=P(Y≤y)=P(max(X,1/X)≤y)=P(X≤y and 1/X≤y)=P(1/y≤X≤y)=FX(y)−FX(1/y)=(1−e−λy)−(1−e−λ/y)=e−λ/y−e−λy
结果与公式法一致,但在计算上更为简便。这提示我们在解题时可以灵活选择最合适的方法。