Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1064217
  • 博文数量: 284
  • 博客积分: 8223
  • 博客等级: 中将
  • 技术积分: 3188
  • 用 户 组: 普通用户
  • 注册时间: 2008-12-01 13:26
文章分类

全部博文(284)

文章存档

2012年(18)

2011年(33)

2010年(83)

2009年(147)

2008年(3)

分类: 数据库开发技术

2009-04-14 13:41:35

   数据库当前最热点的知识在于数据仓库与数据字典。
   整个数据服务分为两个部分:在线事务处理(即OLTP)与数据仓库(或者数据集市)。这两者之间的关系可以这样描述。比如监控系统就是一个大型的数据服务,其中实时数据库部分,相当于在线事务处理,要求相应快速,存储当前生效的数据;而历史数据查询部分,就相当于数据仓库功能,提供过去数据的存储,以支持相应的展现机制,在这部分中,从脏数据源中抽取数据录入数据库的过程叫ETL(数据抽取),存储使用相应的数据模型(分为事实表和维表),然后用报表或画面方式展现分析结果的软件叫在线分析处理(OLAP)。整个数据服务成为BI,即商务智能。
   数据仓库与数据集市之间的区别可以这样描述:以银行为例,每个网点都存储自己本省的数据,如果总行进行查询,就必须从下面具体网点的数据库中调回数据,这称为数据集市;将所有网点的数据全部存在总行的方式就称为数据仓库。
   目前,数据仓库最大的提供商为 Teradata 与 SAS;数据库市场上主流的为Oracle、DB2、Sybase、mysql。其中,Oracle与DB2 为当前数据库市场上最稳定的商用数据库,Sybase最大的优势在于列数据库的存储方式压缩率高,但其不支持并行的设计,使其无法适应高速读写的应用需求,mysql作为商用数据库使用时间比较短,其前期的开源版本由于其内存方式的本质,兼容cluster机制不够理想,并且欠缺大容量数据的支持,市场前景不容乐观;而Oracle和DB2,由于相互的市场不重叠,可以长期共存,Oracle占据中低端市场,DB2面向T级数据市场,且DB2与IBM小型机互相捆绑销售,其价格较之oracle低。
   虽然oracle与DB2先后推出数据仓库软件,希望打入数据仓库市场,但长期以来TeraData的技术优势已经建立,由于关系型数据库面向频繁sql语句而设计,而数据仓库的数据库面向分析设计(Teradata的数据库在ETL时,使用特定Hash算法,将数据分散到不同的物理存储中,从而达到不需要索引文件,加速分析过程的目的),加之Teradata在分析算法方面的优势,Oracle也只能低头。在2007年的Teradata技术峰会上,赞助公司中Oracle的标志被放在最醒目的位置,一方面表现了Teradata的强悍,也从另一个方面表现了oracle公司态度上的转变。
   从上述技术的发展来看,值得思考的地方如下:
   1. 监控系统应该可以参考数据仓库的设计,是否可以在历史数据库设计时,更有利于OLAP的展现;
   2. 监控系统考虑数据库实现时,应区分高中低端客户:高端,使用oracle,或DB2,中端,使用mysql或者sybase(sybase的列数据库性能到底有多强,需要实践证明),低端,考虑其他开源产品。虽然mysql走出了开源世界,但毕竟开源世界里面仍然存在诸多的品牌:PostgreSQL、 Berkeley DB 、Firebird。是继续使用mysql并为之付费,还是继续开源路线使用其他的数据库品牌呢,值得研究。
   3. 最后,考虑IBM、ORacle、TeraData都是专业做OLAP的公司,不知道他们的报表组态方式是否值得研究。
阅读(712) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~