假设检验 (Hypothesis Testing)
假设检验是统计推断的核心,通过样本数据判断对总体的某种假设是否成立。
1. 基本原理 (Core Principles)
1.1 逻辑基础:小概率原理
一个小概率事件在一次试验中几乎是不可能发生的。如果根据假设推断出的某事件发生的概率极小(显著性水平 ),而该事件在实际观测中发生了,我们就拒绝原假设 。
1.2 两类错误 (Type I & II Errors)
注: 在样本量 固定时, 和 不能同时减小。通常控制 ,在此前提下使 尽量小。
1.3 p 值 (p-value)
定义: 值是当原假设 为真时,观测到当前样本结果(或更极端结果)的概率。
- 若 ,在显著性水平 下拒绝 。
- 若 ,在显著性水平 下接受 。
2. 常见检验方法 (Common Tests)
2.1 正态总体均值检验
| 条件 | 统计量 | 分布 |
|---|---|---|
| 已知 | ||
| 未知 |
2.2 正态总体方差检验 ( 检验)
检验 :
3. 深度练习库
练习 1: 检验效能 (Power) 的概念
题目: 解释什么是检验效能 (Power of a Test)?如何提高它?
解答: 检验效能定义为 ,即当 确实不成立时,正确拒绝 的概率。 提高效能的方法:
- 增大样本量 : 这是最直接的方法,能减小抽样误差。
- 增大显著性水平 : 减小 会增大 ,虽然提高了效能但也增加了犯第一类错误的风险。
- 减小随机误差: 通过更精确的实验控制来减小 。
练习 2: 值的单侧与双侧检验
题目: 在单侧检验 中算得 。若改为双侧检验 ,其 值是多少?在 下结论是否改变?
解答: 对于对称分布(如 ),双侧检验的 值通常是单侧检验的两倍(假设观测值落在单侧拒绝域方向)。
- 新 值: 。
- 结论:
- 在单侧检验中,,拒绝 。
- 在双侧检验中,,接受 。 结论: 显著性结论发生了改变。
练习 3: 第一类错误发生的概率
题目: 设我们进行了 20 次独立的假设检验,每次的显著性水平均为 。假设所有原假设其实都是正确的,那么这 20 次检验中至少有一次发生“弃真”错误的概率是多少?
解答: 这是一个典型的二项分布问题。
- 某次检验不发生错误的概率为 。
- 20 次检验都不发生错误的概率为 。
- 至少发生一次错误的概率为 。
结论: 概率高达约 64.2%。这说明了在进行多重比较 (Multiple Comparisons) 时,如果不加修正,犯第一类错误的风险会剧增。