存储经理们就已经意识到了重复数据删除技术的诸多优点。
Federal Reserve银行的存储架构师Michael Thomas在最近的“存储决策大会”上说:“如今我是不会购买一个不具有重复数据删除的二级存储设备的。”
其原因,是显而易见的。最新的虚拟磁带库(VTL)已经将重复数据删除技术作为一大特点包括在内,据称通过删除重复冗余的备份数据,在存储空间上可以为用户提供50:1的压缩比。所节省下的每GB的成本是相当可观的。
IDC.的分析师Robert Amatruda 认为,“随着重复删除的应用,现今VTL的经济性已可以与磁带相比了,”GlassHouse Technologies公司数据保护服务部的副总裁Curtis Preston估计,一个中端磁带库每GB的成本估计在4美元到11美元之间,而无压缩或无重复删除的磁盘每GB的价格大约在3美元到11美元.
VTL的供应商预测,对于保存期为一年的每周全面备份和保存期为十天的每日增量备份,要保证数据在其生命期内的存储,每TB的数据将需要53TB的存储空间。随着存储容量以这种速度增长,任何能够节省这笔资金的方式都会受到用户的欢迎。
重复删除产品的推出,可以帮助用户遏制这种增长速度。主要的厂商包括:Data Domain、Diligent Technologies、ExaGrid、 FalconStor Software、Network Appliance (NetApp)、NEC、Quantum(昆腾)、Sepaton 和Symantec(赛门铁克)。EMC Corp.公司收购了Avamar Technologies公司并计划在今年晚些时候将它的重复删除技术并入其备份部门。HDS与Diligent Technologies公司、IBM公司和NetApp一起合作开发重复删除产品。
Taneja Group.的创始人及咨询分析师Arun Taneja说:“重复数据删除的优点已经相当明显了。”但是,他认为,重复数据删除采用的不同方式和所得到的压缩非常模糊。他警告说,用户应该在自己的数据集下对产品进行彻底的测试。因为厂商更善于技巧性地实现这些数字,而不应该理所当然地就认同接受。
摩托罗拉公司的IT基础架构师Guna Shankar Selvaraj认为,他们对Data Domain公司的进行了评估,但是他发现他们还处在“非常早期的阶段”。
Federal Reserve银行的Thomas说,在决定购买哪种产品之前,他将用六到八个月的时间来测试所有的重复数据删除产品。他说“我想知道[产品]有多少拷贝的索引需要保存,以及如果它们被破坏后会发生什么……所有的一切都是非常重要的。”
UIC Medical Center的企业存储架构师Richard Dearmon关注则是在重复删除之后的数据恢复问题。他说,“我想购买它,可我不清楚二级以及三级备份到底会发生什么。”普遍而言,用户们很想对该技术进行评估,却仍然有很多的问题。
一部分公司则已经采取了行动。CitiStreet使用Sepaton的VTL保存50TB的备份数据,该产品的重复数据删除技术,使其备份集得到了56:1的压缩比。公司对该产品进行了两个月的测试,最终决定在六月底之前将数据转移到该产品上。起初是有一些挑战,但在Sepaton公司的帮助下CitiStreet最终扫平了这些障碍。“他们的重复删除产品对于用户来说就像一个黑匣子----他们过来,打开一些开关,压缩了一些小文件。”不过,CitiStreet公司的全球基础架构副总裁Jeff Machols表示,现在的运行广告说的一样了。随着数据的减少,CitiStreet公司能够对数据进行更长期的保存,而不用担心磁带存储问题。“为了备份和恢复,我们能够保持对有价值数据至少长达一年的在线存储。”Machols说,“我们不必担心要把数据转移到其他的存储介质上。”
不利的证据
有一些证据可能会减慢重复删除的推广。用户关心重复删除、加密和压缩是如何以一种协调的方式共同工作的。摩托罗拉公司的Selvaraj说,“有些时候这些特点会导致自相矛盾…..深入剖析你的数据,这一点是非常重要的,因为并不是所有的数据都能有效地进行重复删除。”
由于越来越多的存储采用在线进行,另一个关心的话题就是电力消耗的问题。有一个用户告诉我们,最近由于电力消耗的问题,不得不关闭一些Data Domain公司的设备。不过,由于话题敏感,他要求隐去名字。
该用户说,“产品的性能的确很棒•••然后我们主管设备的家伙走进来说,要不你把关掉什么,否则我只开始拔插头了……我们没电了。”Data Domain公司的该产品是最后进入数据中心,最早从数据中心撤出的。“我们不得不重新使用磁带,以节省能量。”
在目前阶段,还不清楚面临的能源危机会对存储经理们产生多大的影响。但根据最近一份Gartner报告,这个问题似乎涉及到到IT的所有部门。“到2008年,目前50%的数据中心将不具备足够的电力和冷却能力来满足高密度设备的要求。”Gartner说,到2009年,全世界70%的数据中心将面临能源成本将为第二大运行成本的问
阅读(336) | 评论(0) | 转发(0) |