2008年(8065)
分类: 服务器与存储
2008-09-22 13:05:29
时光进入2007年,情况发生了转机。在日前EMC举行的EMC CAS媒体交流会上,EMC将CAS称为存储领域的第三次浪潮。
是什么触发了存储的新的浪潮?对此,EMC中国区副总裁曹晖的看法是:固定内容数据的快速增长,以及Sarbanes Oxley(萨班斯—奥克斯利法案)、HIPAA(健康保险便利及责任法案)、SEC 17a-4(证券管理委员会第17a-4条法案)等法规遵从方面的要求。
据了解,所谓固定内容数据是指这些数据信息一旦生成就不再变更,例如,各类法律条文、标准和规范的电子文档、数字化医学信息、电子邮件及附件、支票图像、卫星图像、音频/视频信息等,它们类似于光盘存储中的WORM(Write Once Read Many)盘片,一次写入,多次读取。根据美国加州大学伯克利分校所做的调查显示,在全社会每年产生的所有信息中,有超过75%的信息是都属于这类固定内容数据。
针对固定内容数据的存储有两大特点:一是需要长期可靠地保存,例如银行的支票影像、医院的病历,需要作为法律证据,在必要时可以追溯;二是需要经常扩充容量,固定内容的另一个重要来源是数据归档,数据在最初产生时,是作为活动数据保存在管理信息系统中的,每隔一段时间,便需要将不活动的数据归档,腾出空间,提高运行系统的效率。
从这些特点可以看出,固定内容数据的存储属于归档的范畴,而可供选择的存储方法有SAN、NAS和磁带,再有就是CAS。
所谓CAS,就是将所存储数据的二进制内容,按照特定算法计算出一个128比特的奇偶校验,接着,把它转换成一个独特的32个字符的标识符,称为内容地址,或称作数字标签、数字指纹。该数字指纹与存储信息的元数据(metadata)一起构成所访问数据的实际有效地址。
一个固定内容数据有且仅有一个数字指纹,对所存储内容进行任何修改都会被系统检测到,会产生一个不同的数字指纹。如此,就可以确保固定内容数据的准确可靠。我们可以设想,如果要为30个不同的客户端用户,存储同样内容的数据。对于CAS而言,30个用户的元数据是不同的,但内容数据本身只在存储系统上保存一份;而不是30份。如此,其存储以及管理的效率将得到极大的提高。
在CAS中,不是像SAN、NAS是按照地址来存储管理的,而是按照数字指纹进行管理。就像停车场停车,司机不是把车直接开到车库,需要自己记住车位;而是直接将车交给管理员,依靠凭证取车。在CAS存储中,数字指纹相对于凭证,而软件系统相当于车场的管理员。因此,采用CAS存储固定内容数据,其管理和维护非常的简单。这是CAS与SAN、NAS最大的区别。
CAS与磁带的区别在于,CAS是近线存储,而磁带是离线存储,因此CAS的访问效率比较高。此外,在存储介质上,CAS所使用的磁盘显然比磁带更加可靠,耐用。据EMC公司技术解决方案部技术顾问黄斌介绍,EMC的CAS产品——Centera,具有内容镜像、自我康复管理和配置的优点,其性能更加可靠。同时基于CAS的特点,既消除了重复数据,也可以保证存储数据的真实性。据了解,目前惠普、IBM以及HDS都在推广CAS产品。
随着数据量的飞速发展,我们可以预计,CAS有望成为新的存储热点.