Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1460661
  • 博文数量: 1125
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 16710
  • 用 户 组: 普通用户
  • 注册时间: 2008-08-03 14:05
文章分类

全部博文(1125)

文章存档

2011年(1)

2008年(1124)

我的朋友

分类: 服务器与存储

2008-08-13 13:51:28

对硬件的发展速度而言,数据库的功能似乎进展得还不够快。毋庸置疑,今天,信息的存储、组织、管理和访问,依然是计算机技术最重要的领域之一。近年来,随着科学技术、电子商务尤其是 Internet 的迅猛发展,信息的来源、数量、形式和使用方式都发生了很大变化,使传统关系数据库面临着巨大挑战。

 

如今,普通使用者也开始有了在桌面电脑上方便地存储和访问任何形式海量信息的需要,比如自己喜欢的一首歌曲、家里拍的一段视频、一幅扫描的图片,这些现在非得保存为文件的东西,就需要能够直接存入数据库。而检索时,既可以通过一些标识文字,也可以通过乐符查询、人脸识别、甚至是 OCR(光学字符识别)等等更自然的方式。现在有了云计算,各个大公司都怕错过了这班车。

 

事实上,和过去数据库处理的结构化信息不同,我们今天首先要解决的是如何处理复杂类型的数据:文本、时间性、空间性、声音、图形和视频数据等等。最有效的方式,显然是数据库本身就支持它们,将它们作为内置数据类型中的一等公民。数据库如今已经加入了用户定义过程的功能,允许添加带有一定行为的数据类型。但是,过程以及其他可执行代码实现方式比如触发器,都还只是数据库中的二等公民,这一点需要做出改变。

 

对于 P2P 计算能否取代客户端- 服务器模型成为主要数据库存储方案,专家们取得了一致。他们认为P2P 可能更适用于更新较少的应用场合,如果没有任何网络带宽限制的话,P2P 模式才是有可能的,因为它需要大量的数据传输。他们对所谓元组空间(tuple space)计算模型都给予了负面评价。这一计算模型应用与分布式计算。

 

缺乏元数据是目前数据库技术无法解决 Web 中问题的主要原因。举例来说,寻找满足某种条件的一张照片或者一段音乐,就目前而言,是难以解决的。

 

总结一下,传统数据库中的存储着结构化数据,但Web 上是非结构化或者半结构化、异构、稀疏型的数据。自从上世纪 90 年代以来,似乎一夜之间,所有计算机都连接起来了,信息空前激增。但是这些突然出现的信息并不都是由行和列组成的,有跟顺序无关的,还有流式数据比如股票行情报告系统。对于这个方向,有人认为纯 XML 数据库会有美好的未来,有人则不然,觉得面向对象数据库会更好。

 

双方观点如下:

1.XML 在未来的数据库中将处于中心地位,XML 将成为文档交换的主要格式。它是灵活的,而且能够自我描述。许多程序都需要用交换数据的格式进行查询。其他数据都将映射为 XML,通过接口与外界联系。但是关系数据库和 SQL 不会退出历史舞台,因为它们在数据的无关性方面,在处理关系上有着天然的优势。更新和事务处理问题、XML 数据的索引问题需要认真解决,以构建健全的基础设施。

2.实际上目前的主流厂商,都已经在关系数据库中很好地支持了对象。互操作性和兼容性当然重要,XML 作为通用的数据交换模型,因为它的可扩展性,可能会非常适用于各种特殊目的的专门市场,但是绝不会替代关系数据库。

 

目前,在 XML 元素、Java 对象和数据库表行之间进行数据编组(marshalling)和解组是性能的瓶颈所在,这也就是所谓'Web 服务阻抗。

阅读(325) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~