深度优先遍历和广度优先遍历-skykiker-ChinaUnix博客

博客访问： 2970883
博文数量： 199
博客积分： 1400
博客等级：上尉
技术积分： 4126
用户组：普通用户
注册时间： 2008-07-06 19:06

个人简介

半个PostgreSQL DBA，热衷于数据库相关的技术。我的ppt分享https://pan.baidu.com/s/1eRQsdAa https://github.com/chenhuajun https://chenhuajun.github.io

文章分类

全部博文（199）

其他（1）
citus（10）
greenlpum（1）
安全（1）
Pacemaker（3）
MySQL（21）
Symfoware（2）

Native（1）
分布式（0）
C（1）
Solaris（1）
Linux（11）
C#（3）
故障案例（5）
NoSQL（4）
云计算（1）
Windows（3）
Database（13）
PostgreSQL（101）

安装配置（1）

HA（3）

doc（6）

Npgsql（1）

psqlODBC（2）
嵌入式开发（8）
Java开发（2）
生活随笔（3）
未分配的博文（4）

文章存档

2020年（5）

2019年（1）

2018年（12）

2017年（23）

2016年（43）

2015年（51）

2014年（27）

2013年（21）

2011年（1）

2010年（4）

2009年（5）

2008年（6）

我的朋友

相关博文

深度优先遍历和广度优先遍历

分类：数据库开发技术

2010-12-21 18:03:22

深度优先遍历和广度优先遍历

以前做过一个XQuery的项目，其中对Path式的执行采用了深度优先遍历算法。
现在想想，还可以考虑广度优先遍历。它们的对比如下:

可以把节点A匹配Path子式后得到的节点看作节点A的子节点，如果该Path子式不是最后一个Path子式，
则这些子节点是中间节点。

深度优先遍历
优点:节省内存
一次只保存一个中间节点，只有所有的Path子式都匹配完了的最终结果才会输出。
缺点:重复计算
每个Path子式的输出节点都应该是没有重复节点的，采用深度优先遍历算法时不能判断
当前中间节点是否已经被处理过，只能在生成最终结果时消除重复节点。可能会导致重复计算。

广度优先遍历
优点:避免重复计算
处理一个Path子式，可以得到匹配该Path子式得所有中间节点，也就能够消除重复节点。
缺点:内存消耗
需要消耗内存用于存储中间节点。当中间节点数目过大时可能会耗尽内存

在广度优先遍历算法中存储的中间节点数目是可控的，不会超过Dom树的实际节点数。
但深度优先遍历算法中重复计算的次数是不可控的，可能会对性能有极大的影响。
上面的例子相比而言，还是广度优先遍历更好。

另外，SQL的查询处理也有类似的问题。

为了减少磁盘IO，应减少中间结果的输出。
可以将一个元组做完所有运算后再输出最终结果，
但是选择Distinct选项是个障碍，Distinct要求所有选择结果都出来后才知道哪些是重复的。

阅读(5916) | 评论(0) | 转发(0) |

上一篇：关于软件设计的方法

下一篇：博客已升级，请注意变更地址

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6