跳到主要内容

凸函数、不等式与极值应用:分析学的几何灵魂

在微分学中,如果说导数刻画了函数的“速度”,那么凸性(Convexity)则刻画了函数的“趋势”。凸函数理论不仅是数学分析的核心,更是现代最优化理论、概率论与信息论的基石。本专题对标华东师大版《数学分析》第六章,深度系统化凸函数理论及其在不等式证明中的威力。


一、 凸函数的严密定义

1. 几何定义与 Jensen 形式

f(x)f(x) 为定义在区间 II 上的函数。若对 x1,x2I\forall x_1, x_2 \in Iλ(0,1)\forall \lambda \in (0, 1),恒有:

f(λx1+(1λ)x2)λf(x1)+(1λ)f(x2)f(\lambda x_1 + (1-\lambda)x_2) \le \lambda f(x_1) + (1-\lambda)f(x_2)

则称 f(x)f(x)II 上的凸函数 (Convex Function)。

注意:华氏教材中,上述定义对应“下凸”,部分教材(如物理或老版教材)可能称之为“凹”。在本系统中,我们统一采用现代数学术语:开口向上为凸

2. Jensen 不等式(离散形式)

f(x)f(x) 是区间 II 上的凸函数,则对于 xiI\forall x_i \in Iλi>0\forall \lambda_i > 0i=1nλi=1\sum_{i=1}^n \lambda_i = 1,恒有:

f(i=1nλixi)i=1nλif(xi)f\left(\sum_{i=1}^n \lambda_i x_i\right) \le \sum_{i=1}^n \lambda_i f(x_i)

这是凸函数最本质的特征,也是推导所有分析学经典不等式的“母机”。


二、 凸性的判别法

1. 一阶导数判别法(切线特征)

f(x)f(x)II 上可导,则 f(x)f(x) 为凸函数的充要条件是:

f(y)f(x)+f(x)(yx),x,yIf(y) \ge f(x) + f'(x)(y-x), \quad \forall x, y \in I

几何直观:凸函数的图像始终位于其任意一点切线的上方。

2. 二阶导数判别法(曲率特征)

f(x)f(x)II 上二阶可导,则:

  • f(x)f(x) 是凸函数的充要条件是 f(x)0f''(x) \ge 0xI\forall x \in I 成立。
  • f(x)>0f''(x) > 0,则 f(x)f(x)严格凸函数

三、 核心不等式的推导:凸性之美

利用凸函数理论(特别是 Jensen 不等式),我们可以优雅地推导分析学的三大支柱不等式。

1. Young 不等式

p,q>1p, q > 11p+1q=1\frac{1}{p} + \frac{1}{q} = 1。对 a,b>0\forall a, b > 0,有:

abapp+bqqab \le \frac{a^p}{p} + \frac{b^q}{q}

证明概要:利用 lnx\ln x 的凹性(即 lnx-\ln x 的凸性)。 取 f(x)=lnxf(x) = -\ln x,由 Jensen 不等式: ln(1pap+1qbq)1p(lnap)+1q(lnbq)=ln(ab)-\ln(\frac{1}{p}a^p + \frac{1}{q}b^q) \le \frac{1}{p}(-\ln a^p) + \frac{1}{q}(-\ln b^q) = -\ln(ab) 两边取指数即得。

2. Hölder 不等式

p,q>1,1p+1q=1p, q > 1, \frac{1}{p} + \frac{1}{q} = 1。对数项 ai,bi0a_i, b_i \ge 0,有:

i=1naibi(i=1naip)1/p(i=1nbiq)1/q\sum_{i=1}^n a_i b_i \le \left(\sum_{i=1}^n a_i^p\right)^{1/p} \left(\sum_{i=1}^n b_i^q\right)^{1/q}

这是 Cauchy-Schwarz 不等式(p=q=2p=q=2 时)的广义形式。

3. Minkowski 不等式

p1p \ge 1,则:

(i=1n(ai+bi)p)1/p(i=1naip)1/p+(i=1nbip)1/p\left(\sum_{i=1}^n (a_i + b_i)^p\right)^{1/p} \le \left(\sum_{i=1}^n a_i^p\right)^{1/p} + \left(\sum_{i=1}^n b_i^p\right)^{1/p}

其几何意义是 LpL^p 空间下的三角不等式。


四、 极值与最优化应用

凸性提供了全局最优化的保证:

  1. 局部即全局:凸函数在凸集上的局部极小值即为全局最小值。
  2. 极值点判定
    • 一阶必要条件:若 f(x)f(x) 可导且在 x0x_0 取得极值,则 f(x0)=0f'(x_0) = 0
    • 二阶充分条件:若 f(x0)=0f'(x_0) = 0f(x0)>0f''(x_0) > 0,则 x0x_0 为极小值点。

五、 教科书级证明例题 (8+ 深度实战)

例 1:算术-几何平均值不等式 (AM-GM)

证明:x1+x2++xnnx1x2xnn\frac{x_1 + x_2 + \dots + x_n}{n} \ge \sqrt[n]{x_1 x_2 \dots x_n}xi>0x_i > 0 成立。

点击查看证明

考察函数 f(x)=lnxf(x) = -\ln x,其 f(x)=1x2>0f''(x) = \frac{1}{x^2} > 0,为严格凸函数。 由 Jensen 不等式,取 λi=1n\lambda_i = \frac{1}{n}

ln(xin)1n(lnxi)=ln(xi1/n)-\ln\left(\frac{\sum x_i}{n}\right) \le \sum \frac{1}{n}(-\ln x_i) = -\ln\left(\prod x_i^{1/n}\right)

lnx\ln x 的单调性,不等式方向反转,得证。

例 2:常用的指数-对数不等式

证明:对 xR\forall x \in \mathbb{R}ex1+xe^x \ge 1+x

点击查看证明

f(x)=exf(x) = e^x,在 x0=0x_0 = 0 处展开切线。 f(0)=1,f(0)=1f(0) = 1, f'(0) = 1,切线方程为 y=1+xy = 1 + x。 由于 f(x)=ex>0f''(x) = e^x > 0f(x)f(x) 始终位于其切线之上,故 ex1+xe^x \ge 1+x

例 3:Bernoulli 不等式的凸性证明

证明:当 α>1\alpha > 1x>1x > -1 时,(1+x)α1+αx(1+x)^\alpha \ge 1 + \alpha x

点击查看证明

f(t)=(1+t)αf(t) = (1+t)^\alpha。计算 f(t)=α(α1)(1+t)α2f''(t) = \alpha(\alpha-1)(1+t)^{\alpha-2}。 当 α>1,t>1\alpha > 1, t > -1 时,f(t)>0f''(t) > 0,故 f(t)f(t) 为凸函数。 利用切线判别法,在 t=0t=0 处:f(0)=1,f(0)=αf(0)=1, f'(0)=\alpha。 故 f(x)f(0)+f(0)(x0)=1+αxf(x) \ge f(0) + f'(0)(x-0) = 1 + \alpha x

例 4:Ky Fan 不等式的特殊情况

证明:若 xi(0,1/2]x_i \in (0, 1/2],则 xi(xi)n(1xi)((1xi))n\frac{\prod x_i}{(\sum x_i)^n} \le \frac{\prod (1-x_i)}{(\sum (1-x_i))^n}

点击查看证明

考察函数 f(x)=lnx1xf(x) = \ln \frac{x}{1-x}。计算其二阶导。 f(x)=1x(1x)f'(x) = \frac{1}{x(1-x)}, f(x)=2x1x2(1x)2f''(x) = \frac{2x-1}{x^2(1-x)^2}。 当 x(0,1/2]x \in (0, 1/2] 时,f(x)0f''(x) \le 0,即 f(x)f(x) 为凹函数。 利用 Jensen 不等式即可得证。

例 5:利用 Young 不等式证明 Hölder

点击查看证明

A=(aip)1/p,B=(biq)1/qA = (\sum a_i^p)^{1/p}, B = (\sum b_i^q)^{1/q}。 令 a^i=ai/A,b^i=bi/B\hat{a}_i = a_i/A, \hat{b}_i = b_i/B,则 a^ip=1,b^iq=1\sum \hat{a}_i^p = 1, \sum \hat{b}_i^q = 1。 对每一项应用 Young 不等式: a^ib^ia^ipp+b^iqq\hat{a}_i \hat{b}_i \le \frac{\hat{a}_i^p}{p} + \frac{\hat{b}_i^q}{q}ii 求和: a^ib^i1pa^ip+1qb^iq=1p+1q=1\sum \hat{a}_i \hat{b}_i \le \frac{1}{p}\sum \hat{a}_i^p + \frac{1}{q}\sum \hat{b}_i^q = \frac{1}{p} + \frac{1}{q} = 1 还原 A,BA, B 即得 Hölder 不等式。

例 6:凸函数在区间中点的性质

证明:若 f(x)f(x)[a,b][a, b] 上是凸函数,则 f(a+b2)1baabf(x)dxf(a)+f(b)2f\left(\frac{a+b}{2}\right) \le \frac{1}{b-a}\int_a^b f(x) dx \le \frac{f(a)+f(b)}{2}

点击查看证明

此即著名的 Hadamard 不等式

  1. 右边部分:利用凸性 f(ta+(1t)b)tf(a)+(1t)f(b)f(ta + (1-t)b) \le tf(a) + (1-t)f(b),对 t[0,1]t \in [0, 1] 积分。
  2. 左边部分:利用 f(a+b2)=f((ta+(1t)b)+((1t)a+tb)2)f(ta+(1t)b)+f((1t)a+tb)2f(\frac{a+b}{2}) = f(\frac{(ta+(1-t)b) + ((1-t)a+tb)}{2}) \le \frac{f(ta+(1-t)b) + f((1-t)a+tb)}{2},积分即得。

例 7:距离和的最小值问题

在直线 y=0y=0 上找一点 P(x,0)P(x, 0),使得其到 A(0,1)A(0, 1)B(3,2)B(3, 2) 的距离之和最小。

点击查看证明

f(x)=x2+1+(x3)2+4f(x) = \sqrt{x^2+1} + \sqrt{(x-3)^2+4}。 计算 f(x)f''(x) 可证其为严格凸函数,极值点唯一。 利用几何对称性(反射原理),AA 关于 y=0y=0 的对称点 A(0,1)A'(0, -1),连接 ABA'Bxx 轴的交点即为最小值点。 ABA'B 方程:y+1=2(1)30(x0)y=x1y+1 = \frac{2-(-1)}{3-0}(x-0) \Rightarrow y = x-1。 令 y=0y=0, x=1x=1。最小值点为 (1,0)(1, 0)

例 8:Shannon 熵的非负性 (信息论应用)

证明:H(X)=pilogpilognH(X) = -\sum p_i \log p_i \le \log n,其中 pi=1\sum p_i = 1

点击查看证明

考察函数 f(x)=xlogxf(x) = -x \log x(或直接用 logx\log x 的凹性)。 由于 f(x)=1/x<0f''(x) = -1/x < 0(对 log\log 而言),由 Jensen 不等式: 1nlogpilog(pin)=log(1/n)=logn\sum \frac{1}{n} \log p_i \le \log (\frac{\sum p_i}{n}) = \log (1/n) = -\log n 整理得 pilogpilognpilogpilogn\sum p_i \log p_i \ge -\log n \Rightarrow -\sum p_i \log p_i \le \log n


六、 综合练习库

  1. 广义 Jensen:证明积分形式的 Jensen 不等式:f(01g(x)dx)01f(g(x))dxf(\int_0^1 g(x) dx) \le \int_0^1 f(g(x)) dx
  2. 极值应用:周长为 LL 的所有矩形中,哪一个面积最大?用凸性证明。
  3. 不等式链:利用 f(x)=ln(1+ex)f(x) = \ln(1+e^x) 的凸性证明关于 Log-Sum-Exp 的性质。
  4. 切线法强化:证明 sinx+tanx>2x\sin x + \tan x > 2xx(0,π/2)x \in (0, \pi/2) 成立。

编者注:凸性是不等式的灵魂。当你面对一个复杂的不等式感到无从下手时,不妨求一下二阶导,或许几何的光芒会瞬间照亮证明之路。