参数区间估计与假设检验
区间估计和假设检验都是基于小概率原理,即小概率事件在一次试验中基本上不可能发生。
区间估计
区间估计是根据样本估计总体期望 所在的区间。有两个参数,一个是区间长度,一个是落入概率。
概念
从总体 中抽取样本,其样本均值 与总体期望 一般不相等,但其差距通常不大。这一思想可以用概率语言表示为 。
- 是一个很小的正数,称为显著性水平。
- 称为置信度或置信水平。
求置信区间的枢轴变量法:
- 为待估参数 寻找一个良好的点估计量 。
- 构造一个依赖于 和 的函数 ,使其分布已知(如正态分布、 分布、 分布、 分布),且该分布不依赖于任何未知参数。 称为枢轴变量。
- 给定置信度 ,确定两个常数 和 ,使得 。对于双侧置信区间,通常取 和 。
- 从不等式 中解出关于 的不等式 。则 就是 的一个置信度为 的置信区间。 称为置信下限, 称为置信上限。
正态总体均值的置信空间
估计 而 已知
假设总体 ,或者样本容量 很大(中心极限定理)。样本均值 。
构造枢轴变量:
给定置信度 ,查标准正态分布的上 分位点 ,有:
整理得:
因此, 的置信度为 的置信区间为:
估计 而 未知
当 未知时,用样本方差 来代替 。
构造枢轴变量:
给定置信度 ,查 分布的上 分位点 ,有:
整理得:
因此, 的置信度为 的置信区间为:
估计 而 已知
当 已知时,构造枢轴变量:
给定置信度 ,查 分布的分位点 和 ,有:
整理得 的置信度为 的置信区间为:
估计 而 未知
当 未知时,用样本均值 代替 。
构造枢轴变量:
同理, 的置信度为 的置信区间为:
假设检验
已经有了对期望 的假设,对这个假设进行检验。若所处的区间在拒绝域中,就拒绝原假设。
思想
假设检验是先对总体的参数提出一个假设(如 ),然后利用样本信息来判断这个假设是否成立。
其基本思想是小概率原理。如果为使原假设 成立而导致了一个小概率事件的发生,我们就有理由拒绝原假设 。这个小概率 就是显著性水平。
。
如果根据样本计算出的统计量的值落在了小概率事件发生的区间,这个区间就称为拒绝域。
假设检验的类型: 设 为总体未知参数, 为已知常数。
| 类型 | 原假设 | 备择假设 |
|---|---|---|
| 双边检验 | ||
| 右边检验 | ||
| 左边检验 |
假设检验的步骤:
- 根据实际问题提出原假设 与备择假设 。
- 在假定 成立的条件下,构造检验统计量,并确定其分布。
- 给定显著性水平 ,根据 确定拒绝域的形式。
- 根据样本观测值计算出检验统计量的值,判断其是否落入拒绝域。若落入,则拒绝 ;否则,接受 。
正态总体下的六大检验与拒绝域
| 检验参数 | 条件 | 原假设 | 备择假设 | 检验法与统计量 | 拒绝域 |
|---|---|---|---|---|---|
| 已知 | 检验 | ||||
| 未知 | 检验 | ||||
| 已知 | 检验 | 或 | |||
| 未知 | 检验 | 或 | |||
两类错误
在假设检验中,可能会犯两种类型的错误。
| 类型 | 第一类错误 (弃真) | 第二类错误 (取伪) |
|---|---|---|
| 含义 | 原假设 为真,但决策拒绝了 。 | 原假设 为假,但决策接受了 。 |
| 发生概率 | ||
| 说明 | 仅控制犯第一类错误的概率的检验称为显著性检验,该概率即显著性水平。 | 在样本容量 固定的情况下, 减小, 必然增大。要同时减小 和 ,只能增大样本容量 。 |