跳到主要内容

线段树 (Segment Tree): 区间维护的工业级标准

代数抽象:蒙耐德与算子作用

从代数结构看,线段树维护的是一个蒙耐德 (Monoid) (M,)(M, \oplus) 上的元素。

  1. 结合律: (ab)c=a(bc)(a \oplus b) \oplus c = a \oplus (b \oplus c)
  2. 单位元: 存在 eMe \in M 满足 ae=ea=aa \oplus e = e \oplus a = a。 对于区间修改,引入算子作用 (Operator Action) F={f:MM}F = \{f: M \to M\}
  • 复合性: f1(f2a)=(f1f2)af_1 \circ (f_2 \circ a) = (f_1 \circ f_2) \circ a
  • 分配律: f(ab)=(fa)(fb)f \circ (a \oplus b) = (f \circ a) \oplus (f \circ b)。 满足上述性质的任何区间问题均可用线段树在 O(logN)O(\log N) 内解决。

1. 系统化抽象数据类型 (ADT) 推导

线段树是对区间信息的二叉划分映射。设 S={a1,a2,,an}S = \{a_1, a_2, \dots, a_n\} 为原始序列。

1.1 递归构造与分治边界验证

  • Build(L, R):
    • L=RL=R,创建叶节点 uuT(u)=aL\mathcal{T}(u) = a_L
    • 否则,递归构造 mid=(L+R)/2mid = \lfloor (L+R)/2 \rfloor 的左子树与右子树。

分治边界验证 (D&C Boundary Validation): 对于任何区间 [L,R][L, R],其划分为 [L,mid][L, mid][mid+1,R][mid+1, R]

  1. 全覆盖性[L,mid][mid+1,R]=[L,R][L, mid] \cup [mid+1, R] = [L, R]
  2. 互斥性[L,mid][mid+1,R]=[L, mid] \cap [mid+1, R] = \emptyset
  3. 收敛性:由于 mid=(L+R)/2mid = \lfloor (L+R)/2 \rfloor,当 L<RL < R 时,Lmid<RL \le mid < R。这确保了左区间规模 midL+1<RL+1mid - L + 1 < R - L + 1 且右区间规模 R(mid+1)+1<RL+1R - (mid + 1) + 1 < R - L + 1,递归过程严格收敛。

1.2 拓扑一致性校验 (The Non-Commutative Case)

在线段树中维护非交换算子(如矩阵乘法、仿射变换 ax+bax+b)时,标记的复合顺序至关重要。

区间维护一致性分析 (Consistency Analysis): 设节点已存在的标记为 FoldF_{old},新进入的标记为 FnewF_{new},则复合标记应为 Ftotal=FnewFoldF_{total} = F_{new} \circ F_{old}。 在 push_down 时,子节点的标记必须以正确顺序与父节点传下的标记复合。

void apply(int u, const Tag& t) {
val[u] = t(val[u]); // 算子作用
tag[u] = t * tag[u]; // 标记复合:新标记在前
}

2. 复杂度分析与系统化单调性证明

2.1 时间复杂度:O(logN)O(\log N) 剪枝证明

定理:任何区间查询 [ql,qr][ql, qr] 最多访问 4logN4 \log N 个节点。 证明:在每一层中,只有与查询边界相交的区间会分裂。由于只有 2 个边界,每一层最多产生 4 个受影响节点。

2.2 系统化单调性证明 (Monotonicity in Trees)

命题:在线段树上进行二分查找(Segment Tree Binary Search)时,必须依赖维护信息的单调性。

  • 前缀和单调性:若 ai0a_i \ge 0,则前缀和 Sk=i=1kaiS_k = \sum_{i=1}^k a_ikk 单调递增。
  • 查找第一个 V\ge V 的位置: 若 max(ls)V\max(ls) \ge V,则目标位置必在左子树;否则若 max(rs)V\max(rs) \ge V,则在右子树。 这种决策单调性保证了我们可以在 O(logN)O(\log N) 内精确定位。

5. 教材化例题与解析

例题 1:区间最大连续子段和 (GSS)

Check Solution (C++ Implementation)

核心思想:维护区间和 sum、最大前缀和 pre、最大后缀和 suf、最大子段和 dat

struct Node {
long long sum, pre, suf, dat;
Node() : sum(0), pre(-1e18), suf(-1e18), dat(-1e18) {}
Node(long long v) : sum(v), pre(v), suf(v), dat(v) {}
};

Node merge(const Node& l, const Node& r) {
Node res;
res.sum = l.sum + r.sum;
res.pre = std::max(l.pre, l.sum + r.pre);
res.suf = std::max(r.suf, r.sum + l.suf);
res.dat = std::max({l.dat, r.dat, l.suf + r.pre});
return res;
}

例题 2:区间乘加 (维护一致性)

Check Solution

解析:维护两个标记 addaddmulmul。运算顺序定义为 ai=aimul+adda_i = a_i \cdot mul + add。 当新标记 (mul,add)(mul', add') 作用时: ai=(aimul+add)mul+add=ai(mulmul)+(addmul+add)a_i' = (a_i \cdot mul + add) \cdot mul' + add' = a_i \cdot (mul \cdot mul') + (add \cdot mul' + add')

void apply(int u, LL m, LL a) {
val[u] = (val[u] * m + a * len[u]) % mod;
mul[u] = (mul[u] * m) % mod;
add[u] = (add[u] * m + a) % mod; // 标记复合一致性
}

6. 综合练习与解答

  1. [查找边界] 给定序列 ai0a_i \ge 0,查找最小的 kk 使得 i=1kaiS\sum_{i=1}^k a_i \ge S
Check Solution

单调性利用:利用前缀和的单调性,在线段树上递归。

int query(int u, int l, int r, LL &s) {
if (l == r) return l;
int mid = (l + r) >> 1;
if (tr[u << 1].sum >= s) return query(u << 1, l, mid, s);
s -= tr[u << 1].sum;
return query(u << 1 | 1, mid + 1, r, s);
}
  1. [区间取模] 线段树维护区间取模(ai=ai(modm)a_i = a_i \pmod m)。
Check Solution

剪枝证明:若区间最大值 mx<mmx < m,则整个区间取模后不变,可直接剪枝。 由于取模操作会使非零数值至少减半(a(modm)<a/2a \pmod m < a/2ma/2m \le a/2),总复杂度为 O((N+M)logN)O((N+M) \log N)


编者注:线段树的代数本质在于将区间的离散积分分解为对数级的基本单元叠加。