跳到主要内容

抽样分布 (Sampling Distributions)

数理统计研究如何通过样本推断总体的特征。抽样分布是数理统计的理论基础。

1. 总体与样本

  • 总体 (Population):研究对象的全体,通常用随机变量 XX 表示。
  • 样本 (Sample):从总体中随机抽取的个体序列 X1,X2,,XnX_1, X_2, \dots, X_n
  • 独立同分布 (i.i.d.):在简单随机抽样下,XiX_i 独立且与 XX 同分布。

2. 统计量 (Statistics)

统计量是不含任何未知参数的样本函数。常用的统计量包括:

  • 样本均值Xˉ=1ni=1nXi\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i
  • 样本方差S2=1n1i=1n(XiXˉ)2S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2
  • 样本 kk 阶原点矩Ak=1ni=1nXikA_k = \frac{1}{n} \sum_{i=1}^n X_i^k
分母为 n-1

样本方差 S2S^2 的分母为 n1n-1 是为了保证其为总体方差 σ2\sigma^2无偏估计

3. 三大抽样分布

χ2\chi^2 分布 (卡方分布)

X1,,XnX_1, \dots, X_n 独立且均服从标准正态分布 N(0,1)N(0, 1),则: χ2=i=1nXi2χ2(n)\chi^2 = \sum_{i=1}^n X_i^2 \sim \chi^2(n) 其中 nn 称为 自由度

  • E(χ2)=n,Var(χ2)=2nE(\chi^2) = n, \quad Var(\chi^2) = 2n

tt 分布 (学生分布)

XN(0,1)X \sim N(0, 1)Yχ2(n)Y \sim \chi^2(n),且 X,YX, Y 独立,则: T=XY/nt(n)T = \frac{X}{\sqrt{Y/n}} \sim t(n)

  • nn \to \infty 时,t(n)N(0,1)t(n) \to N(0, 1)

FF 分布

Uχ2(n1)U \sim \chi^2(n_1)Vχ2(n2)V \sim \chi^2(n_2),且 U,VU, V 独立,则: F=U/n1V/n2F(n1,n2)F = \frac{U/n_1}{V/n_2} \sim F(n_1, n_2)

4. 正态总体下的常用定理

X1,,XnN(μ,σ2)X_1, \dots, X_n \sim N(\mu, \sigma^2),则:

  1. XˉN(μ,σ2/n)\bar{X} \sim N(\mu, \sigma^2/n)
  2. (n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
  3. Xˉ\bar{X}S2S^2 相互独立
  4. XˉμS/nt(n1)\frac{\bar{X} - \mu}{S / \sqrt{n}} \sim t(n-1)

5. 经典练习

:::info 练习 1 设 X1,,X9X_1, \dots, X_9 为来自 N(0,1)N(0, 1) 的样本,令 Y=X1++X6X72+X82+X92Y = \frac{X_1 + \dots + X_6}{\sqrt{X_7^2 + X_8^2 + X_9^2}}。求使得 cYt(n)cY \sim t(n) 的常数 cc 及自由度 nn。 :::

查看解析

首先,分子 Z=X1++X6N(0,6)Z = X_1 + \dots + X_6 \sim N(0, 6)。 标准化分子:Z=Z6N(0,1)Z' = \frac{Z}{\sqrt{6}} \sim N(0, 1)。 分母平方和 W=X72+X82+X92χ2(3)W = X_7^2 + X_8^2 + X_9^2 \sim \chi^2(3)。 根据 tt 分布定义: T=ZW/3=Z/6W/3=Z2W=12Yt(3)T = \frac{Z'}{\sqrt{W/3}} = \frac{Z/\sqrt{6}}{\sqrt{W/3}} = \frac{Z}{\sqrt{2W}} = \frac{1}{\sqrt{2}} Y \sim t(3)c=12c = \frac{1}{\sqrt{2}}n=3n = 3


本章节为参数估计与假设检验提供理论分布支持。