跳到主要内容

奇异值分解 (Singular Value Decomposition, SVD)

SVD 是线性代数中最强大的分解定理之一,它不仅适用于方阵,还适用于任意形状的矩阵。它是图像压缩、推荐系统(如协同过滤)以及主成分分析 (PCA) 的数学核心。

1. 核心定理

对任意矩阵 AMm×n(R)A \in M_{m \times n}(\mathbb{R}),存在 mm 阶正交矩阵 UUnn 阶正交矩阵 VV,以及 m×nm \times n 阶对角矩阵 Σ\Sigma,使得:

A=UΣVTA = U \Sigma V^T

其中:

  • UU:其列向量称为 左奇异向量,是 AATAA^T 的特征向量。
  • VV:其列向量称为 右奇异向量,是 ATAA^TA 的特征向量。
  • Σ\Sigma:对角线上的元素 σ1σ2σr>0\sigma_1 \ge \sigma_2 \ge \dots \ge \sigma_r > 0 称为 奇异值,是 ATAA^TA(或 AATAA^T)非零特征值的平方根。

2. 几何意义

SVD 说明任何线性变换都可以分解为三步:

  1. 旋转 (VTV^T): 将输入向量旋转到主轴方向。
  2. 拉伸 (Σ\Sigma): 沿主轴方向进行不同比例的缩放。
  3. 再次旋转 (UU): 将缩放后的结果旋转到输出空间的最终位置。
SVD vs 对角化
  • 对角化 (A=PDP1A=PDP^{-1}):要求 AA 是方阵,且基是特征向量。
  • SVD (A=UΣVTA=U\Sigma V^T):适用于任何矩阵,基(U,VU, V)是标准正交的。

3. 紧凑型与截断 SVD

紧凑 SVD (Compact SVD)

只保留非零奇异值。若 AA 的秩为 rr,则: A=UrΣrVrTA = U*r \Sigma_r V_r^T 其中 UrMm×rU_r \in M*{m \times r}VrMn×rV*r \in M*{n \times r}

截断 SVD (Truncated SVD)

只保留前 kk 个最大的奇异值 (k<rk < r)。这是 最优低秩近似(Eckart-Young 定理): Ak=i=1kσiuiviTA*k = \sum*{i=1}^k \sigma_i u_i v_i^T AkA_k 是所有秩为 kk 的矩阵中离 AA 最近的一个(在 Frobenius 范数下)。

4. 应用示例:图像压缩

一张 1000×10001000 \times 1000 的灰度图可以看作一个矩阵。

  • 原始存储:1,000,0001,000,000 个像素。
  • 截断 SVD (取 k=50k=50):存储 (1000+1000+1)×50=100,050(1000+1000+1) \times 50 = 100,050 个数值。
  • 压缩比:约 10:1,且通常能保留大部分视觉特征。

5. 深度例题

例 1:手动计算 2×22 \times 2 矩阵的 SVD

A=(3002)A = \begin{pmatrix} 3 & 0 \\ 0 & -2 \end{pmatrix}

点击查看过程与答案

虽然这是一个对角阵,但我们按步骤演示:

  1. 计算 ATA=(9004)A^TA = \begin{pmatrix} 9 & 0 \\ 0 & 4 \end{pmatrix}
  2. 特征值为 9,49, 4,故奇异值为 σ1=3,σ2=2\sigma_1 = 3, \sigma_2 = 2
  3. VVATAA^TA 的特征向量:v1=(1,0)T,v2=(0,1)Tv_1 = (1,0)^T, v_2 = (0,1)^T
  4. UU 通过 ui=1σiAviu_i = \frac{1}{\sigma_i} Av_i 计算:
    • u1=13(30)=(10)u_1 = \frac{1}{3} \begin{pmatrix} 3 \\ 0 \end{pmatrix} = \begin{pmatrix} 1 \\ 0 \end{pmatrix}
    • u2=12(02)=(01)u_2 = \frac{1}{2} \begin{pmatrix} 0 \\ -2 \end{pmatrix} = \begin{pmatrix} 0 \\ -1 \end{pmatrix}
  5. 结论: A=(1001)(3002)(1001)T.A = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} \begin{pmatrix} 3 & 0 \\ 0 & 2 \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}^T. 注意 UU 里的 1-1 是为了保证 UU 是正交矩阵(且 AV=UΣAV=U\Sigma 成立)。

6. 配套练习

练习 1:奇异值的性质

证明:若 AA 是对称且半正定的矩阵,则其奇异值等于其特征值。

Details

点击查看证明A=QDQTA = QDQ^TAA 的谱分解,其中 QQ 是正交阵,D=diag(λ1,,λn)D = \operatorname{diag}(\lambda_1, \dots, \lambda_n)。 由于 AA 半正定,λi0\lambda_i \ge 0。 我们可以直接取 U=Q,V=Q,Σ=DU=Q, V=Q, \Sigma=D。 则 A=UΣVTA = U \Sigma V^T。 由 SVD 的唯一性(奇异值部分),奇异值即为特征值。

练习 2:Moore-Penrose 伪逆

利用 SVD 定义 AA 的伪逆 A+A^+

Details

点击查看解答A=UΣVTA = U \Sigma V^T。 则 A+=VΣ+UTA^+ = V \Sigma^+ U^T,其中 Σ+\Sigma^+ 是将 Σ\Sigma 的非零对角元取倒数后转置得到的矩阵。 伪逆可用于求解最小二乘问题 Ax=bAx=b 的最优解 x=A+bx = A^+b