跳到主要内容

连续型随机变量 (Continuous Random Variables)

如果对于随机变量 XX累积分布函数 (Cumulative Distribution Function, CDF) F(x)=P(Xx)F(x) = P(X \le x),存在非负可积函数 f(x)f(x),使得对于任意实数 xx,有: F(x)=xf(t)dtF(x) = \int_{-\infty}^x f(t) \, dt 则称 XX连续型随机变量,称 f(x)f(x)XX概率密度函数 (Probability Density Function, PDF)

1. 核心性质

  1. f(x)0f(x) \ge 0 对几乎所有的 xx 成立。
  2. f(x)dx=1\int_{-\infty}^\infty f(x) \, dx = 1
  3. 对任意实数 a<ba < bP(a<Xb)=F(b)F(a)=abf(x)dxP(a < X \le b) = F(b) - F(a) = \int_a^b f(x) \, dx

2. 常见连续分布

  1. 均匀分布 (Uniform Distribution): XU(a,b)X \sim U(a, b)f(x)=1baf(x) = \frac{1}{b-a} (a<x<ba < x < b)。
  2. 指数分布 (Exponential Distribution): XExp(λ)X \sim Exp(\lambda)f(x)=λeλxf(x) = \lambda e^{-\lambda x} (x0x \ge 0)。
  3. 正态分布 (Normal Distribution): XN(μ,σ2)X \sim N(\mu, \sigma^2)f(x)=12πσexp((xμ)22σ2)f(x) = \frac{1}{\sqrt{2\pi}\sigma} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
  4. Gamma 分布: XΓ(α,β)X \sim \Gamma(\alpha, \beta) 是指数分布的推广
  5. Beta 分布: XBeta(α,β)X \sim Beta(\alpha, \beta),定义在 (0,1)(0, 1) 上的灵活分布

3. 数字特征 (Numerical Characteristics)

数学期望 (Expectation)

E(X)=xf(x)dxE(X) = \int_{-\infty}^\infty x f(x) \, dx

方差 (Variance)

Var(X)=(xE(X))2f(x)dx=E(X2)[E(X)]2Var(X) = \int_{-\infty}^\infty (x - E(X))^2 f(x) \, dx = E(X^2) - [E(X)]^2

4. 经典例题

:::info 例题 1 设随机变量 XN(μ,σ2)X \sim N(\mu, \sigma^2),证明 E(X)=μE(X) = \mu。 :::

查看解析

E(X)=12πσxexp((xμ)22σ2)dxE(X) = \frac{1}{\sqrt{2\pi}\sigma} \int_{-\infty}^\infty x \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) \, dxt=xμσt = \frac{x-\mu}{\sigma},则 x=σt+μx = \sigma t + \mudx=σdtdx = \sigma dtE(X)=12π(σt+μ)et2/2dtE(X) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^\infty (\sigma t + \mu) e^{-t^2/2} \, dt E(X)=σ2πtet2/2dt+μ2πet2/2dtE(X) = \frac{\sigma}{\sqrt{2\pi}} \int_{-\infty}^\infty t e^{-t^2/2} \, dt + \frac{\mu}{\sqrt{2\pi}} \int_{-\infty}^\infty e^{-t^2/2} \, dt 由于被积函数 tet2/2t e^{-t^2/2} 是奇函数,其积分为 00;第二个积分为标准的正态分布积分,结果为 2π\sqrt{2\pi}E(X)=0+μ2π2π=μE(X) = 0 + \frac{\mu}{\sqrt{2\pi}} \cdot \sqrt{2\pi} = \mu

:::info 例题 2 若 XExp(λ)X \sim Exp(\lambda),求其中位数。 :::

查看解析

设中位数为 mm,满足 F(m)=0.5F(m) = 0.5。 指数分布的 CDF 为 F(x)=1eλxF(x) = 1 - e^{-\lambda x} (x0x \ge 0)。 1eλm=0.5    eλm=0.5    λm=ln(0.5)1 - e^{-\lambda m} = 0.5 \implies e^{-\lambda m} = 0.5 \implies -\lambda m = \ln(0.5) m=ln2λm = \frac{\ln 2}{\lambda}

5. 正态分布的重要性质

68-95-99.7 法则

对于标准正态分布 ZN(0,1)Z \sim N(0, 1)

  • P(Z1)68.27%P(|Z| \leq 1) \approx 68.27\%
  • P(Z2)95.45%P(|Z| \leq 2) \approx 95.45\%
  • P(Z3)99.73%P(|Z| \leq 3) \approx 99.73\%

中心极限定理的预兆:独立随机变量之和的分布在一定条件下收敛于正态分布,这解释了正态分布在自然界中的普遍性。


6. 计算验证:C++ 正态分布模拟

以下代码通过 Box-Muller 变换生成正态分布随机数,并验证其统计特性。

点击查看 C++ 验证代码
#include <iostream>
#include <math>
#include <random>
#include <vector>
#include <iomanip>

using namespace std;

// Box-Muller 变换生成标准正态分布
pair<double, double> box_muller(double u1, double u2) {
double r = sqrt(-2.0 * log(u1));
double theta = 2.0 * M_PI * u2;
return {r * cos(theta), r * sin(theta)};
}

int main() {
random_device rd;
mt19937 gen(rd());
uniform_real_distribution<double> uniform(0.0, 1.0);

const int N = 1000000;
vector<double> samples;

// 生成正态分布样本
for (int i = 0; i < N / 2; ++i) {
double u1 = uniform(gen);
double u2 = uniform(gen);
// 避免 u1 = 0
while (u1 == 0) u1 = uniform(gen);

auto [z1, z2] = box_muller(u1, u2);
samples.push_back(z1);
samples.push_back(z2);
}

// 计算统计量
double sum = 0, sum_sq = 0;
for (double x : samples) {
sum += x;
sum_sq += x * x;
}

double mean = sum / N;
double variance = sum_sq / N - mean * mean;

// 计算各区间频率
int within_1 = 0, within_2 = 0, within_3 = 0;
for (double x : samples) {
if (abs(x) <= 1.0) within_1++;
if (abs(x) <= 2.0) within_2++;
if (abs(x) <= 3.0) within_3++;
}

cout << fixed << setprecision(4);
cout << "样本数量: " << N << endl;
cout << "样本均值: " << mean << " (理论值: 0)" << endl;
cout << "样本方差: " << variance << " (理论值: 1)" << endl;
cout << "\n68-95-99.7 法则验证:" << endl;
cout << "P(|Z| <= 1): " << (double)within_1 / N * 100 << "% (理论: 68.27%)" << endl;
cout << "P(|Z| <= 2): " << (double)within_2 / N * 100 << "% (理论: 95.45%)" << endl;
cout << "P(|Z| <= 3): " << (double)within_3 / N * 100 << "% (理论: 99.73%)" << endl;

return 0;
}

本章节由 SolKnow 系统根据标准教材重写。