跳到主要内容

笔记 | 平摊分析

提示

这是我在北京大学算法设计与分析课上所作的一次课堂报告。

动态表

题目

分别给出使用下列策略的动态表的插入与删除操作的平摊复杂度以及势能函数定义.

  1. 元素满时扩大 1 倍空间, 元素不足 1/3 时减少 1/2 空间.
  2. 元素满时扩大 1/3 倍空间, 元素不足 4/9 时减少 1/3 空间.

动态表的势函数

  1. Φ()=0\Phi(\varnothing) = 0;
  2. T is list,Φ(T)0\forall T \textrm{ is list}, \Phi(T) \ge 0;
  3. 在扩张或收缩前, Φ(T)\Phi(T) 取极大值;
  4. 在扩张或收缩完成后, Φ(T)\Phi(T) 取极小值; 插入/删除的开销为 11, 扩张/收缩操作的开销为 T.numT.num. 发生扩张/收缩时, 势函数的下降抵消了扩张/收缩的开销.

问题 1

元素满时扩大 1 倍空间, 元素不足 1/3 时减少 1/2 空间. 装载比变化:扩张:1 → 1/2;收缩:1/3 → 2/3;范围:α[13,1]\alpha \in \left[\frac{1}{3},1\right].

Φ(T)=T.size×{2(12α)if α<12,0if 12α<23,3(α23)if α23,={T.size2T.numif α<12,0if 12α<23,3T.num2T.sizeif α23, \begin{align*} \Phi(T) &= T.size \times \begin{cases} 2\left(\frac{1}{2}-\alpha\right) && \textrm{if } \alpha < \frac{1}{2},\\ 0 && \textrm{if } \frac{1}{2} \le \alpha < \frac{2}{3},\\ 3\left(\alpha-\frac{2}{3}\right) && \textrm{if } \alpha \ge \frac{2}{3}, \end{cases}\\ &=\begin{cases} T.size - 2T.num && \textrm{if } \alpha < \frac{1}{2},\\ 0 && \textrm{if } \frac{1}{2} \le \alpha < \frac{2}{3},\\ 3T.num-2T.size && \textrm{if } \alpha \ge \frac{2}{3}, \end{cases}\ \end{align*}

未触发扩张/收缩时, ΔΦ(T)3\Delta \Phi(T) \le 3, 平摊代价 c^=1+ΔΦ(T)4\hat c = 1 + \Delta \Phi(T) \le 4.

触发扩张/收缩时,ΔΦ(T)=T.num\Delta \Phi(T) = -T.num, 平摊代价 c^=1+T.num+ΔΦ(T)=1\hat c = 1 + T.num + \Delta \Phi(T) = 1. 每个操作的平摊代价为 O(1)O(1), 总代价为 O(n)O(n).

问题 2

Φ(T)={34T.size2T.numif α<12,0if 12α<23,4T.num3T.sizeif α23,\Phi(T) = \begin{cases} \frac{3}{4}T.size - 2T.num && \textrm{if } \alpha < \frac{1}{2},\\ 0 && \textrm{if } \frac{1}{2} \le \alpha < \frac{2}{3},\\ 4T.num-3T.size && \textrm{if } \alpha \ge \frac{2}{3}, \end{cases}

未触发扩张/收缩时, ΔΦ(T)4\Delta \Phi(T) \le 4, 平摊代价 c^=1+ΔΦ(T)5\hat c = 1 + \Delta \Phi(T) \le 5.

触发扩张/收缩时,ΔΦ(T)=T.num\Delta \Phi(T) = -T.num, 平摊代价 c^=1+T.num+ΔΦ(T)=1\hat c = 1 + T.num + \Delta \Phi(T) = 1. 每个操作的平摊代价为 O(1)O(1), 总代价为 O(n)O(n).

伸展树

题目

  1. 单旋伸展树的 Splay 操作平摊复杂度不是 O(logn)O(\log n);

  2. 双旋伸展树的 Splay 操作平摊复杂度为 O(logn)O(\log n).

def splay(x):
while x.p is not None:
if x.p.p is None:
zig(x)
elif (x.p.l == x) == (x.p.p.l == x.p):
zig_zig(x)
else:
zig_zag(x)

伸展树的势函数

T(x)T(x) 为以 xx 为根的子树. 单个节点的势函数为

w(x)=logT(X)w(x) = \log |T(X)|

总势函数为

Φ(T)=xTw(x)\Phi(T) = \sum_{x\in T}w(x)

Φ(T)\Phi(T) 实际上描述了树的平衡程度, 接近平衡时 Φ(T)\Phi(T) 较小.

zig 操作的平摊分析

对于 zig(x), 记 xx 的父节点为 yy, 旋转后的节点为 xx'yy'.

ΔΦ(T)=w(x)+w(y)w(x)w(y)=w(y)w(x)<w(x)w(x)\begin{align*} \Delta\Phi(T) &= w(x') + w(y') - w(x) - w(y) \\ &= w(y') - w(x) \\ &< w(x') - w(x) \end{align*}

平摊代价 c^<w(x)w(x)+O(1)=O(w(x)w(x)+1)\hat c < w(x') - w(x) + O(1) = O(w(x') - w(x) + 1).

单旋伸展树

xx 在 Splay 到根节点的过程中访问的节点为 x=x0,x1,,xhx=x_0,x_1,\ldots,x_h, 其中 xhx_h 为根节点, hh 为树高.

总的平摊代价为

c^<i=1hO(w(xi)w(xi1)+1)=O(xh)O(x)+O(h)=O(h+logn)\begin{align*} \hat c &< \sum_{i=1}^h O(w(x_i) - w(x_{i-1}) + 1) \\ &= O(x_h) - O(x) + O(h) \\ &= O(h + \log n) \end{align*}

zig-zig 操作的平摊分析

对于 zig_zig(x), 记 xx 的父节点与祖父为 yyzz, 旋转后的节点为 xx', yy'zz'.

ΔΦ(T)=w(x)+w(y)+w(z)w(x)w(y)w(z)=w(y)+w(z)w(x)w(y)<w(x)+w(z)2w(x)=3(w(x)w(x))+(w(x)+w(z)2w(x))<3(w(x)w(x))2\begin{align*} \Delta\Phi(T) &= w(x') + w(y') + w(z') - w(x) - w(y) - w(z) \\ &= w(y') + w(z') - w(x) - w(y) \\ &< w(x') + w(z') - 2w(x) \\ &= 3(w(x') - w(x)) + (w(x) + w(z') - 2w(x')) \\ &< 3(w(x') - w(x)) - 2 \end{align*}

zig_zig(x) 的常数为 c1c_1, 可以调整势函数

Φ(T)=c12Φ(T)\Phi'(T) = \frac{c_1}{2}\Phi(T)

平摊代价

c^<c12(3(w(x)w(x))2)+c1=O(w(x)w(x))\hat c < \frac{c_1}{2} \left(3(w(x') - w(x)) - 2\right) + c_1 = O(w(x') - w(x))

zig-zag 操作的平摊分析

对于 zig_zag(x), 记 xx 的父节点与祖父为 yyzz, 旋转后的节点为 xx', yy'zz'.

ΔΦ(T)=w(x)+w(y)+w(z)w(x)w(y)w(z)=w(y)+w(z)w(x)w(y)<w(y)+w(z)2w(x)=2(w(x)w(x))+(w(y)+w(z)2w(x))<2(w(x)w(x))2\begin{align*} \Delta\Phi(T) &= w(x') + w(y') + w(z') - w(x) - w(y) - w(z) \\ &= w(y') + w(z') - w(x) - w(y) \\ &< w(y') + w(z') - 2w(x) \\ &= 2(w(x') - w(x)) + (w(y') + w(z') - 2w(x')) \\ &< 2(w(x') - w(x)) - 2 \end{align*}

zig_zag(x) 的常数为 c2c_2, 再次调整势函数

Φ(T)=max{c1,c2}2Φ(T)\Phi'(T) = \frac{\max{\{c_1,c_2\}}}{2}\Phi(T)

平摊代价

c^<c22(2(w(x)w(x))2)+c2=O(w(x)w(x))\hat c < \frac{c_2}{2} \left(2(w(x') - w(x)) - 2\right) + c_2 = O(w(x') - w(x))

双旋伸展树

xx 在 Splay 到根节点的过程中访问的节点为 x=x0,x1,,xkx=x_0,x_1,\ldots,x_k, 其中 xkx_k 为根节点.

总的平摊代价为

c^<i=1hO(w(xi)w(xi1))+O(1)=O(xk)O(x)+O(1)=O(logn)\begin{align*} \hat c &< \sum_{i=1}^h O(w(x_i) - w(x_{i-1})) + O(1) \\ &= O(x_k) - O(x) + O(1) \\ &= O(\log n) \end{align*}

并查集

题目

对给定的 nn 个元素, 进 xing mm 次并查集操作, 证明:

  1. 只采用按秩合并的并查集的最差复杂度为 Θ(mlogn)\Theta(m \log n).
  2. 采用按秩合并和路径压缩的并查集的平摊复杂度为 O(mα(n))O(m\alpha(n)).
def find_set(x):
if x != x.parent:
# return find_set(x.parent)
x.parent = find_set(x.parent)
return x.parent

按秩合并

秩: x.rankx.rank 为以 xx 为根的树高度的一个上界(如果没有路径压缩, 界是精确的).

def union(x, y):
x, y = find_set(x), find_set(y)
if x.rank > y.rank:
y.parent = x
else:
x.parent = y
if x.rank == y.rank:
y.rank += 1

引理(秩的性质): x.ranklognx.rank \le \left \lfloor \log n \right \rfloor.

证明概要: 加强结论为 x.ranklogTx.rank \le \left \lfloor \log T \right \rfloor, 其中 TTxx 所在的树的大小, 然后使用归纳法.

将大小分别为 TTTT' 的树合并后, 不妨设 TTT\ge T', • 若 T>TT>T', 最大秩不超过 logTlog(T+T)\left \lfloor \log T \right \rfloor \le \left \lfloor \log (T+T') \right \rfloor; • 若 T=TT=T', 最大秩不超过 logT+1=log(T+T)\left \lfloor \log T \right \rfloor + 1 = \left \lfloor \log (T+T') \right \rfloor.

因此, x.ranklogTlognx.rank \le \left \lfloor \log T \right \rfloor \le \left \lfloor \log n \right \rfloor.

按秩合并的时间复杂度

  • find_set: O(find_set(x).rank)=O(logn)O(\texttt{find\_set}(x).rank) = O(\log n);

  • union: O(find_set(x).rank)+O(find_set(y).rank)+O(1)=O(logn)O(\texttt{find\_set}(x).rank) + O(\texttt{find\_set}(y).rank) + O(1) = O(\log n)

进行 mm 次操作的总时间复杂度为 O(mlogn)O(m \log n).

最差情况下, 每次合并从叶子节点出发, 且每次合并的两棵树高度相同, 此时复杂度为 Ω(mlogn)\Omega(m \log n).

路径压缩的势函数

定义单个节点的势函数:

φ(x)={0,if x.rank=0,α(n)×x.rank,if x is a root,ϕ(x),otherwise\varphi(x) = \begin{cases} 0, & \textrm{if } x.rank=0, \\ \alpha(n) \times x.rank, &\textrm{if } x \textrm{ is a root},\\ \phi(x), &\textrm{otherwise} \end{cases}

其中 ϕ(x)\phi(x) 的具体取值留待之后讨论. 需要满足:

  • φ(x)α(n)×x.rank\varphi(x) \le \alpha(n) \times x.rank, 等号成立当且仅当 xx 为根节点或 x.rank=0x.rank = 0.
  • ϕ(x)\phi(x) 只和 xxxx 的父节点的秩有关, 且对 xx 的父节点的秩单调递减.

秩的性质

  • x.ranklognn1x.rank \le \lfloor \log n \rfloor \le n − 1;
  • 按秩合并: x.rank<x.p.rankx.rank < x.p.rank;
  • 满足 x.rank=0x.rank = 0 的节点均为叶子节点(可能同时也为根节点);
  • 节点的秩在并查集操作中不会减少.

推论:

  • 路径压缩的过程不会增加节点的势.

union 操作的平摊分析

union(x, y) 拆分为三个操作: find_set(x), find_set(y)link(x, y).

对于 link(x, y), 不妨设 yy 成为 xx 的父节点:

  • xx 的子节点的势不变;
  • yy 的子节点的势不增加;
  • xx 的势减少 ( ϕ(x)<α(n)×x.rank\phi(x) < \alpha(n) \times x.rank );
  • yy 的势增加或不变, 增量不超过 α(n)\alpha(n).

平摊代价: O(α(n))O(\alpha(n)).

find-set 操作的平摊分析

对于 find_set(x), 记 xx 的深度为 ss, 欲说明 find-set 的平摊代价为 O(α(n))O(\alpha(n)), 只需证明在 xx 的祖先中有至少 sα(n)+O(1)s − \alpha(n) + O(1) 个节点的势减少了, 如此则有:

c^s(sα(n)+O(1))=O(α(n))\hat c \le s − (s − \alpha(n) + O(1)) = O(\alpha(n))

引入 k(x)k(x), 其值只和 xx 及其父节点的秩有关, 且满足 k(x)<α(n)k(x) < \alpha(n), 根据鸽笼原理, 至少有 sα(n)2s − \alpha(n) − 2 个节点存在一个祖先节点, 其 kk 值与这个节点相同.

根据 α(n)\alpha(n) 的定义, k(x)<α(n)Ak(x)(1)n1k(x) < \alpha(n) \Longleftrightarrow A_{k(x)}(1) \le n − 1.

k(x)=max{k:x.p.rankAk(x.rank)}k(x) = \max{\{k : x.p.rank \ge A_k(x.rank)\}}, 满足上述条件.

yyxx 的祖先节点, 且 k(y)=k(x)k(y) = k(x).

路径压缩完成后, xx 的父节点变为根节点 rr, 有

r.ranky.p.rankAk(y.rank)Ak(Ak(x.rank))r.rank \ge y.p.rank \ge A_k(y.rank) \ge A_k(A_k(x.rank))

上式没有对证明起到什么帮助, 但注意到上式最后出现的函数迭代形式. 令 i(x)=max{i:x.p.rankAk(i)(x.rank)}i(x) = \max\left\{i : x.p.rank ≥ A_k^{(i)}(x.rank)\right\}, 则

r.rankAk(x.p.rank)Ak(Ak(i)(x.rank))=Ak(i+1)(x.rank)r.rank \ge A_k(x.p.rank) \ge A_k\left(A_k^{(i)}(x.rank)\right) = A_k^{(i+1)}(x.rank)

因此路径压缩使得 xxi(x)i(x) 增大了.

现在讨论 ϕ(x)\phi(x) 的构造, 需要满足:

  • 0ϕ(x)<α(n)×x.rank0 \le \phi(x) < \alpha(n) \times x.rank.
  • ϕ(x)\phi(x) 只和 xxxx 的父节点的秩有关.
  • ϕ(x)\phi(x)xx 的父节点的秩单调递减.
  • ϕ(x)\phi(x)i(x)i(x) 单调递减.

ϕ(x)=(α(x)k(x))×x.ranki(x)\phi(x) = (\alpha(x) − k(x)) \times x.rank − i(x), 则 find-set 的平摊代价为 O(α(n))O(\alpha(n)).

Loading...