算法导论（十四）－－数据结构的扩张-yourtommy-ChinaUnix博客

淘米挣＊博文精选yourtommy.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

yourtommy

博客访问： 1855714
博文数量： 438
博客积分： 9799
博客等级：中将
技术积分： 6092
用户组：普通用户
注册时间： 2012-03-25 17:25

文章分类

全部博文（438）

人工智能（6）
决策支持系统（3）
网络（57）

云计算（9）

Apache（8）

web前端（11）

TCP/IP（29）
数据库（9）

数据库基础（9）
Unix环境高级编程（195）

17-高级IPC（7）

16-网络IPC：套接（8）

15-进程间通信（9）

14-高级I／O（7）

13-守护进程（7）

12-线程控制（11）

11-线程（7）

10-信号（16）

9-进程关系（11）

8-进程控制（16）

7-进程环境（11）

6-系统数据文件和（10）

5-标准I／O库（15）

4-文件与目录（23）

3-文件I/O（15）

2-UNIX标准与实现（10）

1-UNIX系统总览（12）
算法（10）

算法导论（10）
综合（15）

代码之美（11）

性能与优化（4）
Android（12）

Android编程环境（1）

Android 从入门到（11）
高层设计（29）

设计模式Head Fir（21）

重构（8）
编程语言（59）

Java EE（2）

javascript（8）

C语言（6）

Fortran77-90-95（12）

Perl入门（15）

Java编程思想（16）
Linux（41）

makefile（11）

GDB（9）

Linux Shell编程（5）

Linux编辑器（4）

Linux命令（5）

Linux工具（3）

vi（3）

Ubuntu（1）
未分配的博文（2）

文章存档

2019年（1）

2013年（8）

2012年（429）

我的朋友

相关博文

算法导论（十四）－－数据结构的扩张

分类： C/C++

2012-04-12 11:23:33

有些时候，我们需要在一些标准的数据结构（比如双链表、散列表或二叉查找树）上增加一些信息，以便编入新的操作。下面给出一个红黑树进行扩充的例子。

动态顺序统计

在红黑树的每个结点，除了基本的color, left, right , parent域，还增加一个size域，来记录以该结点为根的子树的结点数。一个结点的size可以由它的两个子结点得到：
x.size = x.left.size + x.right.size + 1　（T.nil.size为0。）
基于这个新加的域，我们便可增加新的操作，比如选择第i小的元素：

OS_SELECT(x, i) {
1 r = x.left.size + 1;
2 if i == r
3 return x;
4 else if i < r
5 return OS_SELECT(x.left, i);
6 else
7 return OS_SELECT(x.right, i-r);
}

它其实与第9章里的基本快速排序思想的选择算法差不多。
我们还可以在该数据结构里找到某个元素的秩（即元素在集合的排序）：

OS_RANK(T, x) {
1 r = x.left.size + 1;
2 y = x;
3 while y != T.root {
4 if y == y.parent.right
5 r = y.parent.left.size + 1;
6 y = y.parent;
7 }
8 return r;
}

接下来讨论如何维护该数据结构中的size域。
在插入元素时，分两阶段，阶段一：从根开始向下遍历，直到元素找到可以插入的位置；阶段二：通过旋转来维护红黑性质。在阶段一，我们只需在遍历时经由的所有结点的size增加1便可，时间为 O(lg(n))，在阶段二最多会有O(lg(n))次旋转，每次旋转只需O(1)的时间：重新计算被旋转的元素的size，看下图：

在LEFT_ROTATE里加入下列两行代码以维护size信息：

y.size = x.size; x.size = x.left.size + x.right.size + 1综上所述，插入元素的两个阶段里，维护size息共需O(lg(n))的时间。

同样，在删除元素时，同样分为两个阶段，阶段一：从树中删除元素，阶段二，通过旋转维护红黑信息。对于阶段一，我们可以沿着被删除的元素一直向根遍历，经由的每个结点的size域都减1；在阶段二至多有O(lg(n))次旋转。所以删除操作时维护size域的运行时间同样为O(lg(n))。

如何扩张数据结构

对一种数据结构的扩张过程可分为四个步骤：
１、选择基础数据结构；　（选择红黑树）
２、确定要在基础数据结构中添加哪些信息；　（加入size域）
３、验证可用基础数据结构上的基本修改操作来维护这些新添加的信息；　（插入和删除可以维护size域）
４、设计新的操作。　（OS_SELECT和OS_RANK）

以上给出的是一般模式，不必生硬地遵循。

对于红黑树的扩张，我们可以给出以下概括：
设域f对含n个结点的红黑树进行扩张的域，且假设某结点x的域f的内容可以仅用结点x，x.left和x.right中的信息计算，包括x.left.f和 x.right.f。这样，在插入和删除操作中，我们可以在不影响这两个操作O(lg(n))渐近性能的情况下，对T的所有结点的f值进行维护。

下面再介绍另一个红黑树的扩张：区间树。

区间树中，每个结点的关键字不是简单的整数，而是一个区间[low, high]，域名key同样也更名为interval。在进行关键字比较时，low更小的值作为更小的值放在树的左侧。同时，每个结点还维护一个max 域，它表示以该结点为根的子树里，所有元素里的区间[low, high]的high值中的最大值。

我们这样定义两个区间重叠（overlap）：[low, high]和[low', high']只有在high < low'或high' < low时才不重叠。

基于这个数据结构，我们可以定义一个新操作：给定一个区间i，查找区间树中与i重叠的区间：

INTERVAL_SEARCH(T, i) {
1 x = T.root;
2 while x != T.nil and i does not overlap x.interval {
3 if left != T.nil and x.left.max >= i.low
4 x = x.left;
5 else
6 x = x.right;
7 }
8 return x;
}

阅读(2366) | 评论(0) | 转发(4) |

上一篇：算法导论（十三）－－红黑树

下一篇：数据库基础（－）－－基本知识

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6