Chinaunix首页 | 论坛 | 博客
  • 博客访问: 31648082
  • 博文数量: 409
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 5040
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-28 21:09
文章分类

全部博文(409)

文章存档

2011年(1)

2008年(408)

我的朋友

分类: 服务器与存储

2008-07-29 10:58:41

重复数据删除实测比拼

  通过我们定义的测试方法,DD560设备的第一个全备份所需要的空间为972GB,DXi5500需要957GB,这就表明两种设备备份时的压缩比接近2:1,尽管这和标准磁带驱动器的压缩能力差不多,但两个厂商都对外宣称这是其压缩能力最低表现。

  第二次全备份的时候,DD560使用的空间为992GB,而DXi5500需要1001GB。这些微量的增长主要来自于第一次备份到第二次全备份的这个过程中使用了重复数据删除技术,而重复删除技术在处理过程中增加了大量的指向文件的指针,同时也增加了系统的额外开销。

  Data Domain的DD560采用的是线内的重复数据删除处理技术,Quantum的DXi5500采用的是后处理技术。后者不等整个备份任务结束就开始重复数据删除的处理过程,他会在备份任务执行10分钟之后开始处理,然后一边执行备份任务,一边执行连续的进行重复数据删除的处理。

  第三次全备份的时候,DD560需要的空间增加到1006GB,DXi5500需要的空间是1015GB。第三次全备份数据增长量实际上只改变了不到60GB的数据,因为包含于每一个文件的大量数据都是相同的,并且只有每个文件少量的改变量被写到存储中。

  总之,如果采用普通的虚拟磁带库或者实际的磁带库,2TB的全备份作三次将产生6TB的数据量,而具备重复数据删除处理能力的这些虚拟磁带库每次只损耗1TB的数据空间。通过每个虚拟磁带库,每个实际大小2TB的全备份其实只占用了相对较少的数据空间,所以对于一个2TB的卷,我们可以支持以月为周期的大量的全备份,周而复始的,最终也就使得这些虚拟磁带库的压缩比达到20:1、30:1、50:1甚至更多。


    备份持续速率比拼

  我们认为:与其通过虚拟磁带库来限制备份的速度,不如通过服务器的I/O来限制。因为两台不同的虚拟磁带库通过同一个服务器进行测试的持续读写速度是相似的。

  采用一台单CPU处理器2.8GHz服务器,2GB缓存的服务器,BackupExec报告的备份速度平均值DXi5500为36.96Mb/s,DD560为35.93Mbps,而采用一台双CPU处理器3.4GHz服务器,3GB缓存的服务器,备份速度平均值DXi5500为56.77Mb/s,DD560为60.35Mbps。

  Data Domain设备的性能在我们的恢复测试中稍占上峰,24GB大的文件夹通过DD560恢复需要12分40秒,而DXi5500恢复需要13分05秒。

  除了备份这2TB的数据之外,评测机构还通过微软的LoadSim软件模拟出一个高并发负载的环境对Exchange邮件服务器进行反复测试。但不幸的是,通过LoadSim软件没有找到任何一种方法能够改变备份内容的大小,所以事实上从每个邮件服务器备份出来的信息几乎都是相同的。

  尽管成千上万的相同的信息经过重复数据删除处理,但在备份数据时两个虚拟磁带库的持续备份速率基本相同。我们测试目的主要是给重复数据删除处理引擎最大的压力,以看到其处理能力的最大程度。因为每一个文件都需要经过重复数据删除处理产生相同的指针,这样每个文件都需要访问另一个为重复数据删除处理建立的数据库,所以为重复数据删除处理建立的数据库随着数据的增加越来越快的增长,并且其性能也不会改变或受到影响。这就表明,对于大量相同文件的重复数据删除处理不会成为系统备份的瓶颈。

  对于大量的TB级别的数据,如何减小备份窗口,如何以月为周期更快更简单的存储数据,上述两种产品都可以做到很好。


  综合评点:适用才是最好

  通过以上各个性能指标的测试,用户可以充分的了解这两款虚拟带库在实际使用中的性能对比。但是我们不能做一个简单机械的总结来告诉你,哪个虚拟磁带库更好,或者说最适合你们的应用环境,因为这需要根据用户具体的应用环境综合考虑。

  举个例子,如果你有很多的文件服务器,并且每个用户都有有一些不常变化的根目录,你要存储六个月且每天都做全备份,这就需要你通过一个较小的应用达到一个较高的压缩比率。另一种情况,如果你要备份的时候变化很快的交互性数据库数据,并且需要加密或者彼此间没有太大关系的其他类型数据时,比如视频文件,你就不会有太高的压缩比。

  同样,具备重复数据删除处理的虚拟磁带库与我们平时经常使用的标准磁带库之间是对立的。如果你的虚拟磁带库本质上是用来当作一个高度缓存,用来减小备份窗口,然后再备份到磁带库,那其实只是一个D2D2T的环境要求。

  并且,这种情况下,数据一旦备份到实际的物理磁带库之后,虚拟磁带库上的备份任务随即删除,那样重复数据删除处理的优势就得不到任何一点的表现。在另一方面,当你每周或每月备份近似相同的数据时,带有重复数据删除处理技术的虚拟磁带库才是你最佳的选择。

阅读(373) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~