总体与样本

总体

在数理统计中,我们研究的对象的某项数量指标的全体构成的集合称为总体 (Population)。构成总体的每个成员称为个体 (individual)

从统计的角度看,我们关心的不是个体本身,而是个体上的数量指标。因此,一个总体可以看作是一个随机变量 的所有可能取值的集合。这个随机变量 的分布函数 和数字特征(如期望、方差)被称为总体的分布函数总体的数字特征

根据个体数量的多少,总体可分为有限总体无限总体。在考研数学中,通常将容量很大的有限总体近似看作无限总体来处理。

样本

在概率论中,满足独立性同分布的一系列随机变量被称为独立同分布 (i.i.d.) 随机变量。在数理统计中,这样的随机变量序列被称为简单随机样本

定义

从总体 中抽取一部分个体,其数量指标组成的集合称为样本 (Sample)。样本中包含的个体数量 称为样本容量

在抽样之前,每个被抽到的个体其指标值都是不确定的,因此可以看作是一个随机变量。对于容量为 的样本,我们用一组随机变量 来表示。这个随机变量的向量 称为一个随机样本

若样本 满足以下两个条件,则称其为来自总体 的一个简单随机样本

  1. 代表性:样本中的每个随机变量 与总体 具有相同的分布。即 对所有 成立。简言之,同分布
  2. 独立性 是相互独立的随机变量。

因此,简单随机样本是来自总体的 独立同分布 的随机变量。一次抽样的 个具体观测值 称为样本 的一个样本观测值样本实现

分布

设总体 的分布函数为 是来自该总体的一个样本容量为 的简单随机样本。

  • 分布函数

    由于样本 是独立同分布的,其联合分布函数 为:

    根据独立性,有:

    再根据同分布性,有 ,故:

  • 离散型随机变量联合分布

    若总体 离散型随机变量,其分布律为 。则样本 联合分布律 为:

    其中 为总体 的可能取值。

  • 连续型随机变量联合概率密度

    若总体 连续型随机变量,其概率密度函数为 。则样本 联合概率密度函数 为: