跳到主要内容

第十八章 隐函数定理及其应用

隐函数定理是数学分析中连接代数方程与局部几何结构的桥梁。它不仅解决了方程在局部能否解出显式函数的问题,更为流形理论与约束最优化奠定了分析基础。

核心洞察:线性化的威力

隐函数定理的本质是将非线性方程的局部可解性等价于其线性逼近(导数/雅可比矩阵)的可逆性。只要在该点的线性切空间不与投影方向平行,我们就能在局部“切开”复杂的约束面,将其视为一个标准的显式函数图像。


一、 隐函数存在定理 (Existence of Implicit Functions)

1. 单个方程情形:从曲线到导数

定理:设 F(x,y)F(x, y) 在点 P0(x0,y0)P_0(x_0, y_0) 的邻域内连续可微,且满足:

  1. 零点条件F(x0,y0)=0F(x_0, y_0) = 0
  2. 非退化条件Fy(x0,y0)0F_y(x_0, y_0) \neq 0 则在 x0x_0 的某个邻域 II 内,唯一存在连续可微函数 y=f(x)y = f(x) 使得 F(x,f(x))0F(x, f(x)) \equiv 0

导数公式推导: 对 F(x,f(x))=0F(x, f(x)) = 0 两边求全导数: Fx+Fydydx=0    dydx=FxFyF_x + F_y \frac{dy}{dx} = 0 \implies \frac{dy}{dx} = -\frac{F_x}{F_y}

2. 隐函数组定理:高维映射的解

定理:设 F:DRn×RmRm\mathbf{F}: D \subset \mathbb{R}^n \times \mathbb{R}^m \to \mathbb{R}^mC1C^1 映射。若在 P0(x0,y0)P_0(\mathbf{x}_0, \mathbf{y}_0) 满足:

  1. F(x0,y0)=0\mathbf{F}(\mathbf{x}_0, \mathbf{y}_0) = \mathbf{0}
  2. 雅可比行列式非零detFy=det(F1y1F1ymFmy1Fmym)0\det \frac{\partial \mathbf{F}}{\partial \mathbf{y}} = \det \begin{pmatrix} \frac{\partial F_1}{\partial y_1} & \dots & \frac{\partial F_1}{\partial y_m} \\ \vdots & \ddots & \vdots \\ \frac{\partial F_m}{\partial y_1} & \dots & \frac{\partial F_m}{\partial y_m} \end{pmatrix} \neq 0 则在 x0\mathbf{x}_0 邻域内唯一确定 C1C^1 映射 y=f(x)\mathbf{y} = \mathbf{f}(\mathbf{x}),且其偏导数阵为: Df(x)=[DyF]1[DxF]D\mathbf{f}(\mathbf{x}) = -[D_{\mathbf{y}}\mathbf{F}]^{-1} [D_{\mathbf{x}}\mathbf{F}]

二、 逆映射定理与局部同胚 (Inverse Mapping Theorem)

1. 逆映射定理

f:URnRnf: U \subset \mathbb{R}^n \to \mathbb{R}^nC1C^1 映射,且在点 x0\mathbf{x}_0 的雅可比矩阵 Df(x0)Df(\mathbf{x}_0) 可逆,则 ffx0\mathbf{x}_0 的某个邻域内是局部微分同胚

  • 意义:这意味着在微观尺度下,只要导数矩阵不退化,非线性映射的表现与线性映射(坐标旋转、拉伸)是一致的。
  • 证明要点:利用收缩映射原理(Contraction Mapping Principle)在 Banach 空间中迭代构造不动点。

2. 秩定理 (Rank Theorem)

f:RnRmf: \mathbb{R}^n \to \mathbb{R}^m 的导数矩阵 Df(x)Df(\mathbf{x}) 在点 x0\mathbf{x}_0 附近的秩恒为 kk,则通过局部坐标变换,该映射可以简化为: (x1,,xn)(x1,,xk,0,,0)(x_1, \dots, x_n) \mapsto (x_1, \dots, x_k, 0, \dots, 0) 这是研究子流形嵌入的重要工具。


三、 几何应用:切空间与法向量

对于由 F(x)=0\mathbf{F}(\mathbf{x}) = \mathbf{0} 定义的超曲面 Σ\Sigma

  • 法向量:梯度向量 F\nabla F 即为曲面的法向量。
  • 切空间:由所有满足 Fv=0\nabla F \cdot \mathbf{v} = 0 的向量 v\mathbf{v} 构成的超平面。

四、 多元函数的极值与约束最优化

1. 无条件极值:Hessian 判别法

对于驻点 df=0d f = 0,极值性质由 Hessian 矩阵 H=(2fxixj)H = (\frac{\partial^2 f}{\partial x_i \partial x_j}) 决定:

  • 正定     \implies 极小值
  • 负定     \implies 极大值
  • 不定     \implies 鞍点(Saddle Point)

2. Lagrange 乘数法 (Lagrange Multipliers)

ff 在约束 g(x)=0\mathbf{g}(\mathbf{x}) = \mathbf{0} 下的极值。 几何解释:在极值点处,目标函数 ff 的等值面必须与约束面 g=0\mathbf{g}=0 相切。 这意味着 f\nabla f 必须落在由约束函数梯度 {gi}\{\nabla g_i\} 张成的空间中: f+λigi=0\nabla f + \sum \lambda_i \nabla g_i = 0


五、 深度例题:理论与实战

例 1:隐函数组的高阶导数

x+y+z=0,x2+y2+z2=1x+y+z=0, x^2+y^2+z^2=1,求 dzdx\frac{d z}{d x}d2zdx2\frac{d^2 z}{d x^2}

点击查看解析

  1. 一阶导: 对两式关于 xx 求导(视 y,zy, zxx 的函数): 1+y+z=01 + y' + z' = 0 (1) 2x+2yy+2zz=0    x+yy+zz=02x + 2yy' + 2zz' = 0 \implies x + yy' + zz' = 0 (2) 由 (1) 得 y=1zy' = -1 - z',代入 (2): x+y(1z)+zz=0    xy+(zy)z=0    z=yxzyx + y(-1 - z') + zz' = 0 \implies x - y + (z - y)z' = 0 \implies z' = \frac{y-x}{z-y}
  2. 二阶导: 继续对 (1) (2) 关于 xx 求导: y+z=0    y=zy'' + z'' = 0 \implies y'' = -z'' 1+(y)2+yy+(z)2+zz=01 + (y')^2 + yy'' + (z')^2 + zz'' = 0 代入 y=zy'' = -z''1+(y)2+(z)2+(zy)z=0    z=1+(y)2+(z)2zy1 + (y')^2 + (z')^2 + (z-y)z'' = 0 \implies z'' = -\frac{1 + (y')^2 + (z')^2}{z-y}。 (进一步代入 y,zy', z' 即可得到最终显式)。

例 2:雅可比矩阵与反函数的计算

给定 u=x2y2,v=2xyu = x^2 - y^2, v = 2xy,求反映射的导数矩阵 D(u,v)1D(u,v)^{-1}

点击查看解析

  1. 计算正向雅可比矩阵 J=(2x2y2y2x)J = \begin{pmatrix} 2x & -2y \\ 2y & 2x \end{pmatrix}
  2. detJ=4(x2+y2)\det J = 4(x^2+y^2)
  3. 由逆映射定理,Dwf1=[Df]1D_{\mathbf{w}}f^{-1} = [Df]^{-1}[J]1=14(x2+y2)(2x2y2y2x)=(x2(x2+y2)y2(x2+y2)y2(x2+y2)x2(x2+y2))[J]^{-1} = \frac{1}{4(x^2+y^2)} \begin{pmatrix} 2x & 2y \\ -2y & 2x \end{pmatrix} = \begin{pmatrix} \frac{x}{2(x^2+y^2)} & \frac{y}{2(x^2+y^2)} \\ \frac{-y}{2(x^2+y^2)} & \frac{x}{2(x^2+y^2)} \end{pmatrix}