Splay 树
本页面将简要介绍如何用 Splay 维护二叉查找树。
定义
Splay 树, 或 伸展树,是一种平衡二叉查找树,它通过 Splay/伸展操作 不断将某个节点旋转到根节点,使得整棵树仍然满足二叉查找树的性质,能够在均摊 \(O(\log N)\) 时间内完成插入,查找和删除操作,并且保持平衡而不至于退化为链。
Splay 树由 Daniel Sleator 和 Robert Tarjan 于 1985 年发明。
结构
二叉查找树的性质
首先肯定是一棵二叉树!
能够在这棵树上查找某个值的性质:左子树任意节点的值 \(<\) 根节点的值 \(<\) 右子树任意节点的值。
节点维护信息
rt | tot | fa[i] | ch[i][0/1] | val[i] | cnt[i] | sz[i] |
---|---|---|---|---|---|---|
根节点编号 | 节点个数 | 父亲 | 左右儿子编号 | 节点权值 | 权值出现次数 | 子树大小 |
操作
基本操作
maintain(x)
:在改变节点位置后,将节点 \(x\) 的 \(\text{size}\) 更新。get(x)
:判断节点 \(x\) 是父亲节点的左儿子还是右儿子。clear(x)
:销毁节点 \(x\)。
实现
C++ | |
---|---|
1 2 3 4 5 |
|
旋转操作
为了使 Splay 保持平衡而进行旋转操作,旋转的本质是将某个节点上移一个位置。
旋转需要保证:
- 整棵 Splay 的中序遍历不变(不能破坏二叉查找树的性质)。
- 受影响的节点维护的信息依然正确有效。
root
必须指向旋转后的根节点。
在 Splay 中旋转分为两种:左旋和右旋。
过程
具体分析旋转步骤(假设需要旋转的节点为 \(x\),其父亲为 \(y\),以右旋为例)
- 将 \(y\) 的左儿子指向 \(x\) 的右儿子,且 \(x\) 的右儿子(如果 \(x\) 有右儿子的话)的父亲指向 \(y\);
ch[y][0]=ch[x][1]; fa[ch[x][1]]=y;
- 将 \(x\) 的右儿子指向 \(y\),且 \(y\) 的父亲指向 \(x\);
ch[x][chk^1]=y; fa[y]=x;
- 如果原来的 \(y\) 还有父亲 \(z\),那么把 \(z\) 的某个儿子(原来 \(y\) 所在的儿子位置)指向 \(x\),且 \(x\) 的父亲指向 \(z\)。
fa[x]=z; if(z) ch[z][y==ch[z][1]]=x;
实现
C++ | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 |
|
Splay 操作
Splay 操作规定:每访问一个节点 \(x\) 后都要强制将其旋转到根节点。
Splay 操作即对 \(x\) 做一系列的 splay 步骤。每次对 \(x\) 做一次 splay 步骤,\(x\) 到根节点的距离都会更近。定义 \(p\) 为 \(x\) 的父节点。Splay 步骤有三种,具体分为六种情况:
-
zig: 在 \(p\) 是根节点时操作。Splay 树会根据 \(x\) 和 \(p\) 间的边旋转。\(zig\) 存在是用于处理奇偶校验问题,仅当 \(x\) 在 splay 操作开始时具有奇数深度时作为 splay 操作的最后一步执行。
即直接将 \(x\) 左旋或右旋(图 1, 2)
-
zig-zig: 在 \(p\) 不是根节点且 \(x\) 和 \(p\) 都是右侧子节点或都是左侧子节点时操作。下方例图显示了 \(x\) 和 \(p\) 都是左侧子节点时的情况。Splay 树首先按照连接 \(p\) 与其父节点 \(g\) 边旋转,然后按照连接 \(x\) 和 \(p\) 的边旋转。
即首先将 \(g\) 左旋或右旋,然后将 \(x\) 右旋或左旋(图 3, 4)。
-
zig-zag: 在 \(p\) 不是根节点且 \(x\) 和 \(p\) 一个是右侧子节点一个是左侧子节点时操作。Splay 树首先按 \(p\) 和 \(x\) 之间的边旋转,然后按 \(x\) 和 \(g\) 新生成的结果边旋转。
即将 \(x\) 先左旋再右旋、或先右旋再左旋(图 5, 6)。
Tip
请读者尝试自行模拟 \(6\) 种旋转情况,以理解 Splay 的基本思想。
实现
C++ | |
---|---|
1 2 3 4 5 |
|
Splay 操作的时间复杂度
因为 zig 和 zag 是 对称 操作,我们只需要对 zig,zig−zig,zig−zag 操作分析复杂度。采用 势能分析,定义一个 \(n\) 个节点的 splay 树进行了 \(m\) 次 splay 步骤。可记 \(w(x)=[\log(\operatorname{size}(x))]\), 定义势能函数为 \(\varphi =\sum w(x)\),\(\varphi (0) \leq n \log n\),在第 \(i\) 次操作后势能为 \(\varphi (i)\), 则我们只需要求出初始势能和每次的势能变化量的和即可。
-
zig: 势能的变化量为
\[ \begin{aligned} 1+w'(x)+w'(fa)−w(x)−w(fa) & \leq 1+w'(fa)−w(x) \\ & \leq 1+w'(x)−w(x) \end{aligned} \] -
zig-zig: 势能变化量为
\[ \begin{aligned} 1+w'(x)+w'(fa)+w'(g)−w(x)−w(fa)−w(g) & \leq 1+w'(fa)+w'(g)−w(x)−w(fa) \\ & \leq 1+ w'(x)+w'(g)−2w(x) \\ & \leq 3(w'(x)−w(x)) \end{aligned} \] -
zig-zag: 势能变化量为
\[ \begin{aligned} 1+w'(x)+w'(fa)+w'(g)−w(x)−w(fa)−w(g) & \leq 1+w'(fa)+w'(g)−w(x)−w(fa) \\ & \leq 1+w'(g)+w'(fa)−2w(x) \\ & \leq 2 w'(x)−w'(g)−w'(fa) + w'(fa)+w'(g)−w(x)−w(fa) \\ & \leq 2(w'(x)−w(x)) \end{aligned} \]
由此可见,三种 splay 步骤的势能全部可以缩放为 \(\leq 3(w'(x)−w(x))\). 令 \(w^{(n)}(x)=w'^{(n-1)}(x)\),\(w^{(0)}(x)=w(x)\), 假设 splay 操作一次依次访问了 \(x_{1}, x_{2}, \cdots, x_{n}\), 最终 \(x_{1}\) 成为根节点,我们可以得到:
继而可得:
因此,对于 \(n\) 个节点的 splay 树,做一次 splay 操作的均摊复杂度为 \(O(\log n)\)。因此基于 splay 的插入,查询,删除等操作的时间复杂度也为均摊 \(O(\log n)\)。
插入操作
过程
插入操作是一个比较复杂的过程,具体步骤如下(假设插入的值为 \(k\)):
- 如果树空了,则直接插入根并退出。
- 如果当前节点的权值等于 \(k\) 则增加当前节点的大小并更新节点和父亲的信息,将当前节点进行 Splay 操作。
- 否则按照二叉查找树的性质向下找,找到空节点就插入即可(请不要忘记 Splay 操作)。
实现
C++ | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 |
|
查询 x 的排名
过程
根据二叉查找树的定义和性质,显然可以按照以下步骤查询 \(x\) 的排名:
- 如果 \(x\) 比当前节点的权值小,向其左子树查找。
- 如果 \(x\) 比当前节点的权值大,将答案加上左子树(\(size\))和当前节点(\(cnt\))的大小,向其右子树查找。
- 如果 \(x\) 与当前节点的权值相同,将答案加 \(1\) 并返回。
注意最后需要进行 Splay 操作。
实现
C++ | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|
查询排名 x 的数
过程
设 \(k\) 为剩余排名,具体步骤如下:
- 如果左子树非空且剩余排名 \(k\) 不大于左子树的大小 \(size\),那么向左子树查找。
- 否则将 \(k\) 减去左子树的和根的大小。如果此时 \(k\) 的值小于等于 \(0\),则返回根节点的权值,否则继续向右子树查找。
实现
C++ | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
|
查询前驱
过程
前驱定义为小于 \(x\) 的最大的数,那么查询前驱可以转化为:将 \(x\) 插入(此时 \(x\) 已经在根的位置了),前驱即为 \(x\) 的左子树中最右边的节点,最后将 \(x\) 删除即可。
实现
C++ | |
---|---|
1 2 3 4 5 6 7 |
|
查询后继
过程
后继定义为大于 \(x\) 的最小的数,查询方法和前驱类似:\(x\) 的右子树中最左边的节点。
实现
C++ | |
---|---|
1 2 3 4 5 6 7 |
|
合并两棵树
过程
合并两棵 Splay 树,设两棵树的根节点分别为 \(x\) 和 \(y\),那么我们要求 \(x\) 树中的最大值小于 \(y\) 树中的最小值。合并操作如下:
- 如果 \(x\) 和 \(y\) 其中之一或两者都为空树,直接返回不为空的那一棵树的根节点或空树。
- 否则将 \(x\) 树中的最大值 \(\operatorname{Splay}\) 到根,然后把它的右子树设置为 \(y\) 并更新节点的信息,然后返回这个节点。
删除操作
过程
删除操作也是一个比较复杂的操作,具体步骤如下:
首先将 \(x\) 旋转到根的位置。
- 如果 \(cnt[x]>1\)(有不止一个 \(x\)),那么将 \(cnt[x]\) 减 \(1\) 并退出。
- 否则,合并它的左右两棵子树即可。
实现
C++ | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 |
|
实现
C++ | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 |
|
例题
以下题目都是裸的 Splay 维护二叉查找树。
习题
参考资料与注释
本文部分内容引用于 algocode 算法博客,特别鸣谢!
本页面的全部内容在 小熊老师 - 莆田青少年编程俱乐部 0594codes.cn 协议之条款下提供,附加条款亦可能应用