在微分学中,如果说导数刻画了函数的“速度”,那么凸性(Convexity)则刻画了函数的“趋势”。凸函数理论不仅是数学分析的核心,更是现代最优化理论、概率论与信息论的基石。本专题对标华东师大版《数学分析》第六章,深度系统化凸函数理论及其在不等式证明中的威力。
设 f(x) 为定义在区间 I 上的函数。若对 ∀x1,x2∈I 及 ∀λ∈(0,1),恒有:
f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2)
则称 f(x) 为 I 上的凸函数 (Convex Function)。
注意:华氏教材中,上述定义对应“下凸”,部分教材(如物理或老版教材)可能称之为“凹”。在本系统中,我们统一采用现代数学术语:开口向上为凸。
若 f(x) 是区间 I 上的凸函数,则对于 ∀xi∈I 及 ∀λi>0 且 ∑i=1nλi=1,恒有:
f(∑i=1nλixi)≤∑i=1nλif(xi)
这是凸函数最本质的特征,也是推导所有分析学经典不等式的“母机”。
设 f(x) 在 I 上可导,则 f(x) 为凸函数的充要条件是:
f(y)≥f(x)+f′(x)(y−x),∀x,y∈I
几何直观:凸函数的图像始终位于其任意一点切线的上方。
设 f(x) 在 I 上二阶可导,则:
- f(x) 是凸函数的充要条件是 f′′(x)≥0 对 ∀x∈I 成立。
- 若 f′′(x)>0,则 f(x) 是严格凸函数。
利用凸函数理论(特别是 Jensen 不等式),我们可以优雅地推导分析学的三大支柱不等式。
设 p,q>1 且 p1+q1=1。对 ∀a,b>0,有:
ab≤pap+qbq
证明概要:利用 lnx 的凹性(即 −lnx 的凸性)。
取 f(x)=−lnx,由 Jensen 不等式:
−ln(p1ap+q1bq)≤p1(−lnap)+q1(−lnbq)=−ln(ab)
两边取指数即得。
设 p,q>1,p1+q1=1。对数项 ai,bi≥0,有:
∑i=1naibi≤(∑i=1naip)1/p(∑i=1nbiq)1/q
这是 Cauchy-Schwarz 不等式(p=q=2 时)的广义形式。
设 p≥1,则:
(∑i=1n(ai+bi)p)1/p≤(∑i=1naip)1/p+(∑i=1nbip)1/p
其几何意义是 Lp 空间下的三角不等式。
凸性提供了全局最优化的保证:
- 局部即全局:凸函数在凸集上的局部极小值即为全局最小值。
- 极值点判定:
- 一阶必要条件:若 f(x) 可导且在 x0 取得极值,则 f′(x0)=0。
- 二阶充分条件:若 f′(x0)=0 且 f′′(x0)>0,则 x0 为极小值点。
证明:nx1+x2+⋯+xn≥nx1x2…xn 对 xi>0 成立。
点击查看证明
考察函数 f(x)=−lnx,其 f′′(x)=x21>0,为严格凸函数。
由 Jensen 不等式,取 λi=n1:
−ln(n∑xi)≤∑n1(−lnxi)=−ln(∏xi1/n)
由 lnx 的单调性,不等式方向反转,得证。
证明:对 ∀x∈R,ex≥1+x。
点击查看证明
设 f(x)=ex,在 x0=0 处展开切线。
f(0)=1,f′(0)=1,切线方程为 y=1+x。
由于 f′′(x)=ex>0,f(x) 始终位于其切线之上,故 ex≥1+x。
证明:当 α>1 且 x>−1 时,(1+x)α≥1+αx。
点击查看证明
令 f(t)=(1+t)α。计算 f′′(t)=α(α−1)(1+t)α−2。
当 α>1,t>−1 时,f′′(t)>0,故 f(t) 为凸函数。
利用切线判别法,在 t=0 处:f(0)=1,f′(0)=α。
故 f(x)≥f(0)+f′(0)(x−0)=1+αx。
证明:若 xi∈(0,1/2],则 (∑xi)n∏xi≤(∑(1−xi))n∏(1−xi)。
点击查看证明
考察函数 f(x)=ln1−xx。计算其二阶导。
f′(x)=x(1−x)1, f′′(x)=x2(1−x)22x−1。
当 x∈(0,1/2] 时,f′′(x)≤0,即 f(x) 为凹函数。
利用 Jensen 不等式即可得证。
点击查看证明
设 A=(∑aip)1/p,B=(∑biq)1/q。
令 a^i=ai/A,b^i=bi/B,则 ∑a^ip=1,∑b^iq=1。
对每一项应用 Young 不等式:
a^ib^i≤pa^ip+qb^iq
对 i 求和:
∑a^ib^i≤p1∑a^ip+q1∑b^iq=p1+q1=1
还原 A,B 即得 Hölder 不等式。
证明:若 f(x) 在 [a,b] 上是凸函数,则 f(2a+b)≤b−a1∫abf(x)dx≤2f(a)+f(b)。
点击查看证明
此即著名的 Hadamard 不等式。
- 右边部分:利用凸性 f(ta+(1−t)b)≤tf(a)+(1−t)f(b),对 t∈[0,1] 积分。
- 左边部分:利用 f(2a+b)=f(2(ta+(1−t)b)+((1−t)a+tb))≤2f(ta+(1−t)b)+f((1−t)a+tb),积分即得。
在直线 y=0 上找一点 P(x,0),使得其到 A(0,1) 和 B(3,2) 的距离之和最小。
点击查看证明
设 f(x)=x2+1+(x−3)2+4。
计算 f′′(x) 可证其为严格凸函数,极值点唯一。
利用几何对称性(反射原理),A 关于 y=0 的对称点 A′(0,−1),连接 A′B 与 x 轴的交点即为最小值点。
A′B 方程:y+1=3−02−(−1)(x−0)⇒y=x−1。
令 y=0, x=1。最小值点为 (1,0)。
证明:H(X)=−∑pilogpi≤logn,其中 ∑pi=1。
点击查看证明
考察函数 f(x)=−xlogx(或直接用 logx 的凹性)。
由于 f′′(x)=−1/x<0(对 log 而言),由 Jensen 不等式:
∑n1logpi≤log(n∑pi)=log(1/n)=−logn
整理得 ∑pilogpi≥−logn⇒−∑pilogpi≤logn。
- 广义 Jensen:证明积分形式的 Jensen 不等式:f(∫01g(x)dx)≤∫01f(g(x))dx。
- 极值应用:周长为 L 的所有矩形中,哪一个面积最大?用凸性证明。
- 不等式链:利用 f(x)=ln(1+ex) 的凸性证明关于 Log-Sum-Exp 的性质。
- 切线法强化:证明 sinx+tanx>2x 对 x∈(0,π/2) 成立。
编者注:凸性是不等式的灵魂。当你面对一个复杂的不等式感到无从下手时,不妨求一下二阶导,或许几何的光芒会瞬间照亮证明之路。