参数估计是数理统计的重要分支,旨在通过样本数据 X1,X2,…,Xn 推断总体分布中未知的参数 θ。
评价估计量 θ^ 优劣的三大标准:
- 无偏性 (Unbiasedness): E[θ^]=θ。
- 有效性 (Efficiency): 在所有无偏估计量中,方差越小越有效。由 Cramér-Rao 下界 给出最小方差。
- 相合性 (Consistency): 当 n→∞ 时,θ^Pθ。
利用样本矩估计总体矩。令总体 k 阶矩 μk=E[Xk] 等于样本 k 阶矩 Ak=n1∑Xik,联立方程求解。
这是现代统计学中最核心的估计方法。
定义:设总体概率密度函数 (或分布律) 为 f(x;θ),观测值为 x1,…,xn。似然函数 (Likelihood Function) 定义为:
L(θ)=L(x1,…,xn;θ)=∏i=1nf(xi;θ)
极大似然估计量 θ^MLE 是使 L(θ) 达到最大值的 θ:
θ^MLE=argmaxθ∈ΘL(θ)
计算步骤:
- 写出对数似然函数 ℓ(θ)=lnL(θ)=∑i=1nlnf(xi;θ)。
- 求导并令导数为零(似然方程):dθdℓ(θ)=0。
- 验证二阶导数或边界情况以确认最大值。
区间估计不仅给出参数的估计值,还给出了估计的精度。
对于给定的显著性水平 α∈(0,1),若存在统计量 θ^L 和 θ^U,使得:
P(θ^L<θ<θ^U)=1−α
则称区间 [θ^L,θ^U] 为参数 θ 的置信水平为 1−α 的置信区间 (Confidence Interval, CI)。
寻找一个含有参数 θ 和样本 X1,…,Xn 的函数 G(X1,…,Xn;θ),使得:
- G 的分布已知且与未知参数 θ 无关。
- 对于给定的 α,可以找到 a,b 使得 P(a<G<b)=1−α。
- 从 a<G<b 中解出 θ 的范围。
经典案例:正态总体均值 μ 的区间估计
- 若 σ2 已知:使用 Z=σ/nXˉ−μ∼N(0,1)。
- 若 σ2 未知:使用 t=S/nXˉ−μ∼t(n−1),其中 S 为样本标准差。
练习 1: 指数分布的 MLE 推导
题目: 设总体 X∼Exp(λ),其概率密度函数为 f(x;λ)=λe−λx(x>0)。求 λ 的极大似然估计。
解答:
- 写出似然函数:
L(λ)=∏i=1nλe−λxi=λne−λ∑xi
- 取对数:
ℓ(λ)=nlnλ−λ∑i=1nxi
- 求导并令其为 0:
dλdℓ=λn−∑i=1nxi=0
解得: λ^=∑xin=Xˉ1。
结论: 指数分布参数的 MLE 是样本均值的倒数。
练习 2: 均匀分布的特殊情况
题目: 设 X∼U(0,θ),求 θ 的 MLE。注意似然方程在此处失效。
解答:
似然函数为:
L(θ)=∏i=1nθ1I{0≤xi≤θ}=θn1I{max(xi)≤θ}
其中 I 是指示函数。为了使 L(θ) 最大,θ 应该尽可能小。但根据指示函数,θ 必须不小于观测值中的最大值 x(n)。
因此,θ^=X(n)=max(X1,…,Xn)。
注意: 这里似然函数在 X(n) 处不连续,不能用求导法。
练习 3: 置信区间的长度分析
题目: 在正态总体 N(μ,σ2)(σ2 已知)中,若要使均值 μ 的置信水平为 0.95 的置信区间长度减半,样本量 n 需要如何变化?
解答:
置信区间长度 L=2⋅zα/2⋅nσ。
要使 L 变为 L/2,即 L′=21L=2⋅zα/2⋅n′σ。
由于 zα/2 和 σ 不变,必然要求 n′1=21n1。
解得 n′=2n⇒n′=4n。
结论: 样本量需要扩大为原来的 4 倍。