可持久化数据结构: 时间与空间的博弈

核心逻辑：函数式更新与路径复制

可持久化数据结构（Persistent Data Structures）允许访问历史版本并支持分支化修改。

Partial Persistence: 允许查询历史，仅允许修改最新版本。
Full Persistence: 允许在任何版本上进行修改。
核心机制: 写时复制 (Copy-on-Write) 与 结构共享 (Structural Sharing)。

1. 拓扑一致性验证 (Topological Consistency)

在可持久化结构中，拓扑一致性意味着历史版本不可变性 (Immutability)：

路径复制不变性: 修改节点 $u$ 时产生的副本 $u'$ ，其子节点若未发生改变，必须指向原有的物理节点。
逻辑独立性: 对版本 $V_i$ 的修改绝对不能影响版本 $V_j (j < i)$ 的任何拓扑连接或数据属性。

2. 复杂度分析与空间分配证明

2.1 空间分配证明 (Systematic Space Allocation)

定理：采用路径复制的可持久化线段树，单次更新的空间复杂度为 $O(\log N)$ 。证明：

设线段树深度为 $H = \lceil \log_2 N \rceil$ 。
任何单点更新仅影响从根到叶的一条路径，路径长度为 $H+1$ 。
路径复制机制会为该路径上的每个节点创建一个新副本。
总增量空间 $\Delta S = (H+1) \times \text{sizeof}(Node) = O(\log N)$ 。

2.2 时空复杂度边界验证 (Spatiotemporal Boundary Verification)

讨论：可持久化并查集的复杂度

时间边界:
- 若使用可持久化线段树维护 fa[] 数组，find 操作由于不能使用路径压缩（会破坏历史版本），必须使用按秩合并。
- 每次 find 代价为 $O(\log N)$ 级别的线段树查询，总复杂度为 $O(M \log^2 N)$ 。
- 优化: 若能保证树高平衡，且直接在数组上操作，可接近 $O(M \log N)$ 。
空间边界:
- 每次 unite 或 find（若修改）产生 $O(\log N)$ 个线段树节点。
- 总空间 $O(N + M \log N)$ 。

3. 教材化例题与解析

例题 1：可持久化线段树 (主席树)

Check Solution (完整实现)

题目背景：给定序列，查询区间 $[L, R]$ 内第 $K$ 小值。

#include <iostream>
#include <vector>
#include <algorithm>

const int N = 200010, M = N * 40;
int n, m, a[N];
std::vector<int> nums;
int root[N], idx;
struct Node { int l, r, cnt; } tr[M];

int build(int l, int r) {
    int p = ++idx;
    if (l == r) return p;
    int mid = (l + r) >> 1;
    tr[p].l = build(l, mid); tr[p].r = build(mid + 1, r);
    return p;
}

int update(int p, int l, int r, int x) {
    int q = ++idx;
    tr[q] = tr[p];
    if (l == r) { tr[q].cnt++; return q; }
    int mid = (l + r) >> 1;
    if (x <= mid) tr[q].l = update(tr[p].l, l, mid, x);
    else tr[q].r = update(tr[p].r, mid + 1, r, x);
    tr[q].cnt = tr[tr[q].l].cnt + tr[tr[q].r].cnt;
    return q;
}

int query(int q, int p, int l, int r, int k) {
    if (l == r) return l;
    int mid = (l + r) >> 1;
    int cnt = tr[tr[q].l].cnt - tr[tr[p].l].cnt;
    if (k <= cnt) return query(tr[q].l, tr[p].l, l, mid, k);
    else return query(tr[q].r, tr[p].r, mid + 1, r, k - cnt);
}

例题 2：可持久化并查集 (Persistent DSU)

Check Solution

核心逻辑：线段树维护 fa 和 dep（秩）。

int update(int p, int l, int r, int x, int v) {
    int q = ++idx; tr[q] = tr[p];
    if (l == r) { fa[q] = v; dep[q] = dep[p]; return q; }
    int mid = (l + r) >> 1;
    if (x <= mid) tr[q].l = update(tr[p].l, l, mid, x, v);
    else tr[q].r = update(tr[p].r, mid + 1, r, x, v);
    return q;
}
// find(x) 在线段树上递归跳转直到 fa[p] == x

4. 综合练习与解答

[树上主席树] 查询路径 $(u, v)$ 的第 $k$ 小值。

Check Solution

核心逻辑：树上差分。利用 $T_u + T_v - T_{lca} - T_{fa[lca]}$ 的性质在四棵线段树上同步同步跳转。

[历史版本并查集]

Check Solution

核心策略：用可持久化线段树维护 fa[] 数组。必须使用按秩合并。空间复杂度 $O(M \log N)$ 。

[进阶] 可持久化平衡树 (Persistent Treap)

Check Solution

注意事项：必须在 split 和 merge 时下传 copy_node。

void split(int u, int v, int &l, int &r) {
    if (!u) { l = r = 0; return; }
    u = copy_node(u); // 关键！
    if (tr[u].val <= v) {
        l = u; split(tr[u].rs, v, tr[u].rs, r);
    } else {
        r = u; split(tr[u].ls, v, l, tr[u].ls);
    }
    push_up(u);
}

编者注：可持久化结构的精髓在于对“历史”的尊重。它不仅是算法竞赛的利器，更是现代数据库实现快照隔离与并发控制的理论基石。

1. 拓扑一致性验证 (Topological Consistency)​

2. 复杂度分析与空间分配证明​

2.1 空间分配证明 (Systematic Space Allocation)​

2.2 时空复杂度边界验证 (Spatiotemporal Boundary Verification)​

3. 教材化例题与解析​

例题 1：可持久化线段树 (主席树)​

例题 2：可持久化并查集 (Persistent DSU)​

4. 综合练习与解答​

1. 拓扑一致性验证 (Topological Consistency)

2. 复杂度分析与空间分配证明

2.1 空间分配证明 (Systematic Space Allocation)

2.2 时空复杂度边界验证 (Spatiotemporal Boundary Verification)

3. 教材化例题与解析

例题 1：可持久化线段树 (主席树)

例题 2：可持久化并查集 (Persistent DSU)

4. 综合练习与解答