跳到主要内容

假设检验 (Hypothesis Testing)

假设检验是统计推断的核心,通过样本数据判断对总体的某种假设是否成立。

1. 基本原理 (Core Principles)

1.1 逻辑基础:小概率原理

一个小概率事件在一次试验中几乎是不可能发生的。如果根据假设推断出的某事件发生的概率极小(显著性水平 α\alpha),而该事件在实际观测中发生了,我们就拒绝原假设 H0H_0

1.2 两类错误 (Type I & II Errors)

错误辨析
  • 第一类错误 (Type I, α\alpha): H0H_0 为真,但拒绝了 H0H_0(弃真)。
  • 第二类错误 (Type II, β\beta): H0H_0 为假,但接受了 H0H_0(取伪)。

: 在样本量 nn 固定时,α\alphaβ\beta 不能同时减小。通常控制 α\alpha,在此前提下使 β\beta 尽量小。

1.3 p 值 (p-value)

定义: pp 值是当原假设 H0H_0 为真时,观测到当前样本结果(或更极端结果)的概率。

  • pαp \le \alpha,在显著性水平 α\alpha 下拒绝 H0H_0
  • p>αp > \alpha,在显著性水平 α\alpha 下接受 H0H_0

2. 常见检验方法 (Common Tests)

2.1 正态总体均值检验

条件统计量分布
σ2\sigma^2 已知Z=Xˉμ0σ/nZ = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}N(0,1)N(0, 1)
σ2\sigma^2 未知t=Xˉμ0S/nt = \frac{\bar{X} - \mu_0}{S / \sqrt{n}}t(n1)t(n-1)

2.2 正态总体方差检验 (χ2\chi^2 检验)

检验 H0:σ2=σ02H_0: \sigma^2 = \sigma_0^2χ2=(n1)S2σ02χ2(n1)\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)


3. 深度练习库

练习 1: 检验效能 (Power) 的概念

题目: 解释什么是检验效能 (Power of a Test)?如何提高它?

解答: 检验效能定义为 1β1 - \beta,即当 H0H_0 确实不成立时,正确拒绝 H0H_0 的概率。 提高效能的方法:

  1. 增大样本量 nn: 这是最直接的方法,能减小抽样误差。
  2. 增大显著性水平 α\alpha: 减小 β\beta 会增大 α\alpha,虽然提高了效能但也增加了犯第一类错误的风险。
  3. 减小随机误差: 通过更精确的实验控制来减小 σ\sigma
练习 2: pp 值的单侧与双侧检验

题目: 在单侧检验 H1:μ>μ0H_1: \mu > \mu_0 中算得 p=0.03p = 0.03。若改为双侧检验 H1:μμ0H_1: \mu \ne \mu_0,其 pp 值是多少?在 α=0.05\alpha=0.05 下结论是否改变?

解答: 对于对称分布(如 Z,tZ, t),双侧检验的 pp 值通常是单侧检验的两倍(假设观测值落在单侧拒绝域方向)。

  1. pp: p=0.03×2=0.06p = 0.03 \times 2 = 0.06
  2. 结论:
    • 在单侧检验中,0.03<0.050.03 < 0.05,拒绝 H0H_0
    • 在双侧检验中,0.06>0.050.06 > 0.05,接受 H0H_0结论: 显著性结论发生了改变。
练习 3: 第一类错误发生的概率

题目: 设我们进行了 20 次独立的假设检验,每次的显著性水平均为 α=0.05\alpha = 0.05。假设所有原假设其实都是正确的,那么这 20 次检验中至少有一次发生“弃真”错误的概率是多少?

解答: 这是一个典型的二项分布问题。

  1. 某次检验不发生错误的概率为 10.05=0.951 - 0.05 = 0.95
  2. 20 次检验都不发生错误的概率为 (0.95)200.358(0.95)^{20} \approx 0.358
  3. 至少发生一次错误的概率为 10.358=0.6421 - 0.358 = 0.642

结论: 概率高达约 64.2%。这说明了在进行多重比较 (Multiple Comparisons) 时,如果不加修正,犯第一类错误的风险会剧增。