参数点估计
概念
在总体 的分布函数 形式已知,但参数 未知的情况下,我们从总体中抽取样本 ,并根据样本值构造一个适当的统计量 来估计未知参数 。
- 估计量 (Estimator): 用来估计未知参数 的统计量,记为 。它是一个随机变量,因为它是样本的函数。
- 估计值 (Estimate): 根据具体的样本观测值 计算出的估计量的值,记为 。它是一个具体的数值。
方法
矩估计法
矩估计法 (Method of Moments) 的思想是利用样本矩来估计相应的总体矩,即“替换思想”。
核心步骤:
- 求出总体的 阶原点矩 。通常 是未知参数 的函数。
- 写出样本的 阶原点矩 。 只与样本有关。
- 令总体矩等于样本矩,即 。 这会得到一个或一组关于参数 的方程。解此方程组,得到的解即为 的矩估计量。
说明:
-
若只有一个未知参数,通常取 ,令 即可求解。
-
若有两个未知参数(如 ),通常联立一阶和二阶矩:
解这个方程组得到 的矩估计量。
最大似然估计
最大似然估计法 (Maximum Likelihood Estimation, MLE) 的思想是:一个合理的参数估计量应该使得我们从模型中抽取到观测样本的概率最大,即“概率最大原理”。
定义
设总体 的样本 的联合概率密度(或概率质量函数)为 。这个函数被看作是未知参数 的函数,称为似然函数。
- 离散型总体:设其概率质量函数为 ,则似然函数为:
- 连续型总体:设其概率密度函数为 ,则似然函数为:
使似然函数 达到最大值的 称为参数 的最大似然估计量。
步骤
由于 是连乘形式,且 是单调递增函数,最大化 等价于最大化其对数形式,即对数似然函数 。
- 写出似然函数:根据总体分布写出 (或 )。
- 取对数:。
- 求最大值:
- 可导情况:对 关于各未知参数 求偏导,并令其等于 ,得到似然方程组: 解此方程组,得到的解 即为最大似然估计量。
- 不可导或方程无解情况:根据 的单调性,在其定义域内直接寻找最大值点。例如,对于 ,似然函数是 的单调递减函数,其最大值在 的可行域的边界处取得。
最大似然估计的不变性:若 是 的最大似然估计量,则 是 的最大似然估计量。
估计量评判标准
无偏性
无偏性 (Unbiasedness) 指的是估计量的数学期望等于参数的真值。
- 若估计量 的数学期望 等于未知参数 ,即 ,则称 为 的无偏估计量。
- 称为 的偏差 (Bias)。
- 若 ,则称 为 的渐进无偏估计量。
常见结论:
- 样本均值 是总体均值 的无偏估计量,因为 。
- 样本方差 是总体方差 的无偏估计量,因为 。
- 是 的有偏估计量,因为 。
例题:设 是正态总体 的简单随机样本,为使 称为总体方差 的无偏估计量,求
解: 为了使 成为 的无偏估计量,需要满足 。
首先,计算 。
由于 是正态总体 的简单随机样本,这意味着 和 是独立同分布的随机变量,且 , 。
根据方差的定义 ,我们可以得到 。
因此, 且 。
由于 和 相互独立,它们的乘积的期望等于期望的乘积:
。
现在,计算 :
根据期望的线性性质:
代入前面推导出的结果:
。
接下来,计算 :
根据期望的线性性质,常数 可以提出,求和符号也可以和期望互换:
代入 :
求和项共有 个 :
。
为了使 是 的无偏估计量,我们必须有 :
假设总体方差 ,我们可以两边同时除以 :
解出 :
。
有效性
有效性 (Efficiency) 比较的是不同无偏估计量的优劣,方差越小越有效。
- 设 和 都是参数 的无偏估计量。如果 ,则称 比 更有效。
- 最小方差无偏估计量 (MVUE):对 的所有无偏估计量中,方差最小的一个。
一致性
一致性 (Consistency) 或 相合性,指的是当样本容量 无限增大时,估计量依概率收敛于参数真值。
- 对于任意小的正数 ,若估计量 满足: 则称 是 的一致估计量或相合估计量。
判定准则:
- 若估计量 满足:
- 是渐进无偏的:
- 方差趋于零:
- 则 是 的一致估计量。这是由切比雪夫不等式保证的。
- 矩估计量和最大似然估计量通常都具有一致性。