分类:
2008-04-14 12:35:15
来源:builder.com |
编者按:从层次型数据库到关系型数据库,再到目前同时支持关系型和XML的混合型数据库,数据库管理技术进入了混合管理的双重境界。
7月15日,IBM正式在北京发布了其开发代号为Viper的新版数据库软件——DB2 9,这是一种可以管理纯XML和纯关系数据的混合型数据服务器,除了支持传统的表数据模型之外,DB2 9还支持XML文档和消息中固有的层次化数据模型,用户可以在一个表中自由地混合存储传统SQL数据和XML数据,可以使用SQL和XQuery(新出现的XML数据查询标准)来查询和处理这两种形式的数据。从层次型数据库到关系型数据库,乃至目前的同时支持关系型和XML的混合型数据库,在IBM进军数据库40周年之际,数据库也同时迈入了XML时代,进入到混合管理的双重境界。
关系数据库亟待革命性突破
很难想象,目前还有哪些应用与数据库无关。就连微软的下一代操作系统Vista,也要用其数据库来组织其新式的文件系统。可以说,经过多年的发展,数据已经成为整个信息化进程和下一阶段发展的最可宝贵的资源,而数据库技术的发展和进步,也成为最关注的问题。
“历经20多年的发展,关系数据库在基础理论、技术、算法、应用、安全、管理、控制等各个方面已经非常成熟,因此关系数据库产品这些年来的发展脉络基本上就是不断完善现有功能技术、同时扩展一些新的功能。关系数据库产品要形成真正突破,亟待的是一批革命性技术的面市。”上海庄梁信息科技有限公司高级技术专家牛新庄点出了这些年来数据市场波澜不惊的根本原因。毫无疑问,关系型数据库在期待杀手级的应用特性。
XML广泛应用带来数据管理挑战
XML(Extensible Markup Language)技术作为标准化的数据存储格式在当前IT环境中扮演越来越重要的角色,它事实上已经成为数据交换的标准、SOA架构的基石。新版的微软Office软件也将以XML格式存储文档。同时,为了实现在不同的系统和应用程序之间交换数据,大量的企业开始建立SOA(Service Oriented Architecture,面向服务的架构),而XML正是SOA得以建立的基础,因此越来越多的公司开始转向使用XML技术,其数据量正面临着巨大的增长挑战。
Gartner集团高性能市场事业群的副总裁Rita Knox说:“高端出版应用(如航空航天和汽车工业的技术手册)在很久以前就开始使用XML。但目前,XML正在朝着更贴近人们日常生活的领域进军,如银行业。”事实上,XML这种树型结构在现实生活中无处不在。例如,中央、省、市、县的这种关系、企业的组织结构等都是树型结构。IDC最近发布的一份报告显示,在500家受访企业的IT部门中,有29%的企业宣称正在大量使用XML存储库和数据库;有相同比例的受访者称正在探索这方面的应用需求和前景。此外,该项研究还发现XML技术的应用非常广泛,包括编辑器、基于XML的电子表格和XML图表等。其中,约有三分之一的受访者在使用其中的某一种技术。
XML格式的数据应用越来越广泛,却给企业带来了很多麻烦。XML数据模型与传统的关系模型存在较大的区别,关系模型是以关系(表)、属性(列)为基础的,而XML数据模型是以节点(元素、属性、备注等)和节点间存在着的相互关系为基础的,因此,原有的关系型数据库产品如何高效地共享、搜索和管理企业产生的大量XML文档和消息,是数据库领域的厂商们面临的巨大挑战。
中国人民银行软件开发中心系统架构师朱杰就指出:“之前许多关系型数据库厂商都宣称自己的产品可以支持XML,但它们对XML的存储无外乎两种形式,一是将XML文档以文件的方式存储在文件库中(即CLOB形式);二是将XML数据转换成关系型表格存储在关系型数据库中。无论采用哪种方式,在重新获取XML数据的时候,都要经过繁琐的转换工作,给企业带来很多问题。而且数据库的功能绝不仅是存储数据,更重要的是能够很好地管理和方便地使用这些数据。”那么有没有可能开发出纯粹的XML数据库,解决目前面临的困境和疑惑呢?
纯粹XML数据库风险因素多
事实上,开发纯粹的XML数据库是一个新兴的技术领域。虽然XML数据库已经有好几年的发展历史,并且市场上也充斥着大量的XML数据库产品,例如Ixiasoft公司出品的TextML服务器,Software AG公司的Tamino和XYZFind公司的XYZFind服务器,它们都允许数据以XML方式提交,而且提供了XML为基础的查询语句,同时返回的数据也是用XML的格式完成。
然而,这些纯粹的XML数据库产品竞争力却不像想象中的那么强。分析一下原因,一方面,这些XML数据库在技术成熟度上还无法与关系数据库抗衡:关系数据库具有数据结构化、最低冗余度、较高的程序与数据独立性、易于扩充、易于编制应用程序等优点,现在主流的数据库产品绝大多数是关系数据库,如微软的SQLserver、IBM的DB2、Oracle等等;而XML数据库缺乏多重管理、协同工作的能力,规划能力不强、易用性不好,这些大型关系数据库所拥有的种种优点统统在XML数据库技术上难以展现。另一方面,企业如果应用纯粹的XML数据库,相当于引入了一种新型的IT架构,这种架构还没有经过历史应用的考验,它的集成能力、对企业技术人员技能的要求以及未来的持久性生命力还不确定,盲目引入这种新型架构,很可能给企业的IT系统应用留下很多隐患和风险。无疑,XML数据库看起来是未来的方向之一,但是在标准、技术等方面还有待进一步发展和成熟。
老牌数据库厂商开拓混合道路
在数据库的历史上IBM一直扮演着开拓者的角色,从层次数据库到关系数据库,数据库领域的每一座里程碑都与IBM息息相关。1966年,IBM开始进军数据库领域,开创了层次数据库时代。作为这个时代的代表作,IBM开发的IMS(Information Management System)帮助美国航空航天局(NASA)顺利实施“阿波罗太空计划”。1970年,IBM首次提出关系型数据库模型,开创了关系型数据库时代。IBM所提出的这个关系型数据库模型成为此后统领数据库市场30余年的关系型数据库的基础,Oracle、Sybase、MS SQL Server等数据库产品都基于此,IBM也于1983年正式发布命名为DB2的关系型数据库产品。Gartner最近的分析结果显示:关系数据库市场中,IBM占有34.1%的份额。
IBM无疑也看到了XML数据库产品的潜在前景和现有风险。从国内现状看,纯XML数据库的使用还不广泛,应用厂商不太想用这种技术,因为这需要对原有系统进行重新规划,这种架构的变更会带来一定的技术风险。一般企业的信息技术领导也不太愿意去承担这种技术风险,毕竟关系数据库的应用已经在企业中游刃有余,任何变化带来的风险都是企业短期内难以承受的。IBM 在这个时候推出DB2 9混合数据库结构,就是希望帮助用户做一个过渡,在原有系统和现有变更之间建立一个缓冲地带。通过DB2 9,企业用户可以使用同一个数据库对象同时管理“传统的”SQL数据和“新型的”XML文档,甚至还可以编写一个查询同时搜索和处理这两种数据形式。
“DB2 9包含68项专利,它是由分布在全球8个国家的750名开发人员历时5年开发的。”IBM 院士、IBM中国开发中心总经理郑妙勤女士对DB2 9的特性如数家珍。她指出,IBM DB2 9提供了与以前版本非常不同的体系结构,它通过提供新的查询语言、新的存储技术、新的索引技术和支持XML数据及其固有层次结构的特性,使得IBM DB2 9成为IBM的第一个“混合型”(即多结构)数据库管理系统。除了支持表数据模型之外,DB2 还支持XML文档和消息中固有的层次化数据模型。用户可以在一个表中自由地混合存储传统SQL数据和最新的XML数据,还可以使用SQL和XQuery来查询和处理这两种形式的数据。
另外,IBM DB2 9采用了“基于标签的访问控制”(LBAC,Label Based Access Control)模式,这样确保每一条记录都有特定的授权,使得数据的安全性能更高。此外,DB2 9的自主管理特性进一步加强,许多功能,比如页面刷新与磁盘预读进程管理、存储管理、数据库恢复和重定向脚本生成等管理工作,可无须在人工干预的情况下完成,这样将DBA(Database Administer)从烦琐的工作中解放出来去做一些深层次的管理、开发工作;而表分区模式的采用,使企业能在更少的约束下获取更大的数据容量。 |