[转载]海量关系数据库的压缩存储与查询策略-cauwtj-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

首页　| 　博文目录　| 　关于我

博客访问： 45019
博文数量： 42
博客积分： 2520
博客等级：少校
技术积分： 610
用户组：普通用户
注册时间： 2008-04-10 13:46

文章分类

全部博文（42）

未分配的博文（42）

文章存档

2008年（42）

我的朋友

最近访客

浪花小雨

推荐博文

[转载]海量关系数据库的压缩存储与查询策略

分类：

2008-04-27 01:12:26

海量关系数据库的压缩存储与查询策略

摘要:本文针对海量关系数据库的压缩存储和查询的问题，提出了基于同类型的同质属性划分
的策略，使得关系数据库类型相同和相似的列放在一起进行存储，这种从垂直属性划分派生
出来的方法使得数据可以获得比较大的压缩比，同时解决了垂直属性划分对查询效率的影
响。本文还提出了基于同质属性的划分的压缩存储下的关系代数的代价模型的修改，同时提
出了在这种存储上对原有查询操作实现的修改策略。
关键字:压缩数据库海量数据同质属性划分代价模型查询策略

1.引言
最近几年，随着信息技术的发展，特别是 Internet 技术的发展，世界各国的信息量都
12
呈爆炸性增长趋势，高于 10 字节的海量数据库已成为常见的数据库。例如，美国 NASA 发
15
射的人造卫星每年要向地面返回10 字节的观测数据。美国劳伦斯国家实验室的高能物理实
14
验数据高达每年3×10 字节。现在Internet 上已经拥有的数据量达到万亿至兆亿字节量级，
并且处在不断扩充之中。
海量数据对当前的数据库管理技术提出了挑战。对于海量数据库进行存储当前最主要的
方法是使用 3 级存储器进行存储[1]和并行存储和查询技术[2]。但是这些方法对于数据的存储
最大的不足之处在于对于硬件的开销比较大,而且需要开发专门的数据库系统对其进行管理,
而且他们最本质的思路就是以扩充硬件设备来获取大的存储空间,加大存储容量的同时大大
增加的查询的处理时间。并行数据库技术虽然利用多个处理机获取的高速的处理速度，但代
价是增加硬件开销，而且处理的增长速度要低于硬件设备的处理速度。因此，当前对海量数
据库更加经济的一种存储方法是对数据库里需要存储的数据进行压缩，这样一方面可以大大
减小存储容量，另一方面如果对数据库中的数据进行压缩而可以不经过解压缩就可以进行处
理，可以大大减小磁盘的I/O 数量，而磁盘的I/O 是数据库查询处理的主要瓶颈之一。
数据库压缩[3]技术的根据是数据本身存在着冗余，方法是根据数据库的存储模式，对于
特定模式的数据库进行特定形式的压缩。并且数据库压缩技术可以和并行数据库相结合，获
取更高的处理效率。

阅读(347) | 评论(0) | 转发(0) |

0

上一篇：[转载]SQL Server修复数据与备份

下一篇：[转载]在SQL Server数据库中如何减少死锁发生

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们