统计量与分布

统计量

是来自总体 的一个样本,统计量是样本 的函数

关键特性:统计量中不含任何未知参数。

  • 例如,设总体 的均值为 ,方差为 (均为未知参数)。
  • 是一个统计量。
  • 是一个统计量。
  • 不是统计量,因为它包含了未知参数

常用统计量

为样本,总体均值为 ,方差为

  1. 样本均值 性质:,

  2. 样本方差 性质:,即样本方差是总体方差的无偏估计

  3. 样本标准差

  4. 样本 阶原点矩 特别地,

  5. 样本 阶中心矩 特别地,,

顺序统计量

概念

将样本观测值 按从小到大的顺序排列,得到 。称 为第 顺序统计量

  • 样本极小值:
  • 样本极大值:
  • 样本极差(全距):
  • 样本中位数:

性质

设总体 的概率密度函数为 ,分布函数为

  1. 样本极大值 的分布函数与密度函数:

  2. 样本极小值 的分布函数与密度函数:

  3. 顺序统计量 的密度函数:

三大分布

分布

概念

相互独立,且都服从标准正态分布 ,则随机变量

服从自由度为 分布 (卡方分布),记为

性质

  1. 期望与方差,
  2. 可加性:设 , ,且 相互独立,则
  3. 分位数:对给定的 ,称满足 的点 分位数

分布

概念

, ,且 相互独立,则随机变量

服从自由度为 分布 (学生氏分布),记为

性质

  1. 概率密度函数 是一个关于 对称的偶函数,其图像关于纵轴对称。
  2. 期望与方差:当 时,;当 时,
  3. 分位数:上 分位数 满足 。由对称性可知
  4. 极限分布:当 时, 分布的极限是标准正态分布

分布

概念

, ,且 相互独立,则随机变量

服从自由度为 分布,记为 称为第一自由度, 称为第二自由度。

性质

  1. 倒数性质:若 ,则
  2. 分位数:上 分位数 满足 。由倒数性质可得:
  3. 分布的关系:若 ,则

正态总体的抽样分布

是来自正态总体 的一个样本, 是样本均值, 是样本方差。

单个正态总体

  1. 重要性质:样本均值 与样本方差 相互独立

  2. ,标准化后有:

  3. 卡方统计量

  4. 统计量 (最常用):

两个正态总体

是来自 的样本, 分别为其样本均值和方差。

是来自 的样本, 分别为其样本均值和方差。两样本相互独立。

  1. 统计量 特别地,若 ,则

  2. 统计量 (假设 未知):

    • 构造 合并样本方差
    • 相应的 统计量为:

例题

[问答题]

为来自总体 的简单随机样本, 为样本均值, 为样本方差,则正确的是

  • A.
  • B.
  • C.
  • D.
[答案]

答案:C

已知条件:,样本容量 ,总体均值

A 选项分析: 。 该统计量不符合 t 分布的 结构。故 A 错误。

B 选项分析: 根据样本均值的分布,。 标准化后得到 。 其平方服从自由度为 1 的卡方分布: 选项中自由度为 2,故 B 错误。

C 选项分析:。 由于 独立同分布,我们有: 由于 相互独立,所以 也相互独立。 将它们标准化: 根据卡方分布的定义,两个独立的标准正态变量的平方和服从自由度为 2 的卡方分布: 代回 的表达式: 故 C 正确。

此统计量结构符合单个总体的 F 统计量形式 \frac{n(\bar{X}-\mu)^2}{S^2}。 本题中 n=4, \mu=1,所以 F = \frac{4(\bar{X}-1)^2}{S^2} \sim F(1, n-1) = F(1, 3) 选项给出的分布是 F(3,1),第一自由度和第二自由度颠倒,故 D 错误。