二维随机变量数字特征

数学期望

是二维随机变量 的函数,其数学期望 的计算方法如下:

  • 离散型随机变量 的联合分布律为 ,则 该期望存在的前提是上述级数绝对收敛。

  • 连续型随机变量 的联合概率密度为 ,则 该期望存在的前提是上述积分绝对收敛。

重要性质

  1. 对于任意常数 ,有
  2. 相互独立,则
  3. 相互独立 是两个函数,则

协方差和相关系数

概念

  • 协方差 协方差Covariance)是用来度量两个随机变量之间线性关系强度的数字特征。记为

    • 定义式
    • 计算式(更常用):
  • 相关系数 相关系数Correlation Coefficient)是标准化后的协方差,排除了两个变量量纲的影响,更客观地度量它们之间的线性相关程度。记为

    • 定义式 其中 。也写作
  • 相关性的描述

    • ,称 不相关
    • ,称 正相关
    • ,称 负相关
    • ,称 完全线性相关

协方差的标准化

协方差 的数值大小与 的量纲(单位)有关,这使得它在比较不同随机变量之间的线性关系强度时存在局限性。例如,将身高从米变为厘米,会导致其方差和与其他变量的协方差发生数值上的巨大变化,但其内在的线性关系并未改变。

为了消除量纲的影响,可以对随机变量进行标准化Standardization),得到标准化随机变量

其中

标准化随机变量具有如下性质:

  • 期望为
  • 方差为

计算标准化随机变量 的协方差:

这正是相关系数 的定义。因此,相关系数 的本质就是对随机变量 标准化后的协方差。它是一个无量纲的量,其绝对值大小客观地反映了两个变量间的线性相关程度。

性质

协方差的性质

  1. 对称性:
  2. 自身关系:
  3. 相互独立 ( 不相关)。
    • 重要:反之不成立。即 不能推出 相互独立。
    • 特例:若 服从二维正态分布,则 不相关是 相互独立的充要条件
  4. 线性性质:
  5. 方差和差公式: 推广到 个随机变量:

相关系数的性质

  1. 有界性:
  2. 完全线性相关的充要条件: 对某些常数 成立。
    • 时,(完全正相关)。
    • 时,(完全负相关)。
  3. 相关系数对线性变换的性质:设 是常数,且 ,则 这表明相关系数对变量的单位和原点的选择不敏感,只与其线性关系的方向有关。