Chinaunix首页 | 论坛 | 博客
  • 博客访问: 30178972
  • 博文数量: 409
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 5040
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-28 21:09
文章分类

全部博文(409)

文章存档

2011年(1)

2008年(408)

我的朋友

分类: 服务器与存储

2008-07-28 21:28:36

VTL(虚拟磁带库)通过利用磁盘模拟磁带的方式构建虚拟的磁带库系统,避免了传统磁带库大量的机械操作,提高了系统备份的效率。作为传统磁带库的补充,在执行备份/恢复工作中承担重要的任务。

但实际上,VTL并没有实现用户最初对它的期望。主要原因在于:VTL是基于磁盘的在线设备,存在着数据安全的风险;对于管理员则意味着改变传统备份工作模式,如VTL将数据传输到远程站点,需用网络传输方式替代磁带;而对于已经采购了高端磁带库的用户来说,也面临着新的难题。

除此之外,用户在实际应用过程中,也产生了新的需求。例如,改善数据保护的成本,使用户能够处理指数级增长的数据,延长数据在线存放的时间以及加快数据恢复速度等。因此,用户在VTL产品的选购中应特别注意重复数据删除技术的考虑。

在存储的售价一直不停下降的情况下,用户需要保存和备份的数据量却攀升迅速。重复数据删除技术不但可以实现高压缩率,释放存储空间,也可以降低基于磁盘备份的成本。我们将具有重复数据删除技术的VTL产品与其他数据保护技术比较,发现重复数据删除技术拥有众多优势。

目前,很多厂商的产品都含有重复数据删除功能,只是各家的实现方式各有不同。究其原因,用户的目的只有一个,就是为TB级的备份数据节省成本。一般说来,201的压缩比例是比较容易达到的数值。但实际的结果在很大程度上则取决于备份数据类型和备份方式。

如果将重复数据删除技术分类,可以简单比做是“载体派”和“独立派”。独立派是以赛门铁克、Avamar等为代表,主张在数据的根源上就对其重复部分进行删除。载体派顾名思义是因为拥有载体,而其主要的支持者就是VTL厂商,实现的形式则是产品中的一个新特性。这一派的领导厂商包含昆腾、SepatonData Domain等。所以,这两类厂商的方案中,压缩结果、单独的备份流量性能以及近期数据和早期数据的恢复性能就各有差异。这些指标可以作为用户选购VTL产品的参考。

另外,对于有数据中心应用的用户来说,比较适合选择载体派的解决方案。它不但具有更好的性能,也降低了存储数据所需要的磁盘空间容量,并且其中的大多数方案都很容易与现有的架构融为一体,很少导致系统运转的中断。实施VTL方案的费用较高,即使不包含备份软件及其他费用,单点的成本预计也要达到2万美元。相比之下,独立派的方案就显得划算的多。当然,独立派方案并不适合所有的用户,对于大多数拥有大型独立服务器(容量达到20~30TB)的环境来说,数据恢复性能会慢到令人无法忍受的地步。

除了上面说到的功能比较、成本比较以及实现方式的比较外,用户在选购产品时还需要关心的就是压缩率、备份执行速度以及是否支持其他的管理功能。

在压缩率的具体实现上,Lempel-Ziv技术和delta技术是比较常见的。Lempel-Ziv使用的是基于流的方式减少数据存储空间。这种技术创建了一个重复数据模式的字典,并在一个较小的数据窗口内进行查找。这种算法是删除数据窗口内所有的重复数据模式并以字典中的指针替代。在数据窗处理结束时,字典将被清空。但下一个处理过程仅将窗口作为数据参考,所以会忽略一些重复数据,只能提供至多31的压缩率。

delta冗余删除技术可搜索任意数量的数据对象,以找出重复的数据序列,然后用一个副本的指针替代重复数据。重复数据序列中只有一个实例存储在磁盘上,预计可达到201的删除率消除典型混合业务数据中的重复数据。如果为了实现更大的删除比例,将delta技术和Lempel-Ziv结合使用,预计删除比可达到301,甚至更高。

相关链接

最强音

■ 数据去重技术降低了当备份恢复应用由主存储向二级存储转移时产生的数据量暴增的程度。不局限于数据中心,对于面临数据增长失控的异地分站也同样适合。

■ 在购买时, 除了要考虑混合数据应用时的数据压缩率,还需要明确整体性能和单独的备份流量性能、对于近期备份数据和早期备份数据的恢复效果、同时恢复这两类数据的情况以及单独恢复这两个数据的情况。

阅读(537) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~