总体与样本
总体
在数理统计中,我们研究的对象的某项数量指标的全体构成的集合称为总体 (Population)。构成总体的每个成员称为个体 (individual)。
从统计的角度看,我们关心的不是个体本身,而是个体上的数量指标。因此,一个总体可以看作是一个随机变量 的所有可能取值的集合。这个随机变量 的分布函数 和数字特征(如期望、方差)被称为总体的分布函数和总体的数字特征。
根据个体数量的多少,总体可分为有限总体和无限总体。在考研数学中,通常将容量很大的有限总体近似看作无限总体来处理。
样本
在概率论中,满足独立性和同分布的一系列随机变量被称为独立同分布 (i.i.d.) 随机变量。在数理统计中,这样的随机变量序列被称为简单随机样本。
定义
从总体 中抽取一部分个体,其数量指标组成的集合称为样本 (Sample)。样本中包含的个体数量 称为样本容量。
在抽样之前,每个被抽到的个体其指标值都是不确定的,因此可以看作是一个随机变量。对于容量为 的样本,我们用一组随机变量 来表示。这个随机变量的向量 称为一个随机样本。
若样本 满足以下两个条件,则称其为来自总体 的一个简单随机样本:
- 代表性:样本中的每个随机变量 与总体 具有相同的分布。即 对所有 成立。简言之,同分布。
- 独立性: 是相互独立的随机变量。
因此,简单随机样本是来自总体的 个独立同分布 的随机变量。一次抽样的 个具体观测值 称为样本 的一个样本观测值或样本实现。
分布
设总体 的分布函数为 , 是来自该总体的一个样本容量为 的简单随机样本。
-
分布函数
由于样本 是独立同分布的,其联合分布函数 为:
根据独立性,有:
再根据同分布性,有 ,故:
-
离散型随机变量联合分布
若总体 是离散型随机变量,其分布律为 。则样本 的联合分布律 为:
其中 为总体 的可能取值。
-
连续型随机变量联合概率密度
若总体 是连续型随机变量,其概率密度函数为 。则样本 的联合概率密度函数 为: