虚拟磁带库的概念早在10余年前即已被IBM,StorageTek等著名存储厂商所采用。然而,受限于当时的磁盘成本,以及厂家为了保护其既有模拟磁带库市场的考量,长期以来虚拟磁带库一直以价格高昂著称,应用局限性大,市场认知度也较低。
近些年,随着磁盘技术快速发展,出现了多种类型磁盘(SCSI、FC、ATA、SATA),使单位容量磁盘存储的价格急剧下降,进而使得虚拟带库这种利用磁盘作为备份介质的设备,应用也愈加广泛,逐渐成为较为常见的备份模式和方案,而重复数据删除以及CDP等等备份领域的新兴技术,进一步加速了虚拟带库在备份环境中的普及应用。
虚拟带库应用普及
为揭秘厂商虚拟带库产品在实际应用环境下的真实性能如何,IT168特别组织编译了针对市场上主流的几款虚拟带库的详尽的评测报告。评测报告的结果表明:
通常情况下,虚拟磁带库都会使用重复删除数据处理技术,但其相应的成本也会有所改变。带有重复数据删除技术的虚拟带库系统能够为将来整体数据存储的容量缩减做到很好的准备,特别是能够灵活的维护一个高级别的数据系统,并且更简易的处理整个系统。
参与测试的厂商众多,在此我们先公布了两款目前较为主流的虚拟带库的详细测试情况: Quantum DXi5500虚拟带库和Data Domain DD560虚拟带库,他们都将经过Windows平台的测试。此外,其他一些厂商,包括NetApp,Sepaton以及FalconStor等等新产品的测试报告将随后陆续为大家提供。
我们在Windows 2003操作系统平台安装Symantec's BackupExec 11d备份管理软件,备份2TB的数据,通过2Gbps的光纤接口与每台设备连接。我们先对同样的数据保存两个全备份,然后我们通过一个脚本改变1361个文件的内容,总计改变的量为60GB,然后我再做第三个全备份。
这两种设备都能够获得较高的数据压缩比和吞吐量,当您的备份系统的性能要求他要具备多并行流备份技术的同时,必须注意到备份的成本因为备份数据的类型而发生改变,其数据类型固有的压缩能力直接影响到重复数据删除技术有效性。
如何测试虚拟带库
测试的环境是,将两台服务器连通过QLogic 5200光纤交换机连接到Nexsan的 SATA刀片存储系统上。所有的光纤通道都采用2Gbps接口。每台虚拟磁带库通过光纤通道连接到光纤交换机,并且与服务器的连通性都经过了校验。
SATA刀片存储系统备份成两个1.5TB的分区,每个分区包含1TB的数据容量,然后通过Symantec BackupExec 11d备份管理软件将两个分区的数据全备份到虚拟磁带库系统中。首先对两个分区做一个全备份,接着在不改变任何数据的情况下做第二个全备份。接着,通过一个脚本改变1361个文件的内容,总计改变的量为60GB,然后再做第三个全备份。
与其通过虚拟磁带库来限制备份的速度,不如通过服务器的I/O来限制。因为两台不同的虚拟磁带库通过同一个服务器进行测试的持续读写速度是相似的。采用一台单CPU处理器2.8GHz服务器,2GB缓存的服务器,测试速度大约为36Mb/s,而采用一台双CPU处理器3.4GHz服务器,3GB缓存的服务器,测试速度大约为60Mb/s。
除了备份这2TB的数据之外,评测机构还通过微软的LoadSim软件模拟出一个高并发负载的环境对Exchange邮件服务器进行反复测试。但不幸的是,通过LoadSim软件没有找到任何一种方法能够改变备份内容的大小,所以事实上从每个邮件服务器备份出来的信息几乎都是相同的。
这样产生的结果是,经过两天不停的测试,一个40GB大小的Exchange邮件系统产生了几兆的增量,并且我们备份的策略是在前一个全备份结束后立即执行下一个全备份,但是,经过重复删除处理的存储的所有数据的大小却只有仅仅的2K,附带2千万个指针。
两种系统中总共经过重复删除处理的存储数据量大约为50MB,这就表明,多个指向数据的指针容量是真实的数据大小的很多倍,因为有2千万个信息指向记录着这些指针。尽管每一个文件先通过重复删除处理进行备份(也就是说重复的数据已经存储在磁盘阵列中了),其备份的速度也不会降低,同时也说明重复数据处理这个功能不会成为影响备份速度的瓶颈。
Data Domain DD560详测细节
测试的DD560采用了15块500GB的硬盘,总结裸容量7.5TB,可用容量4.928TB。对外采用2Gb/s的光纤通道。
价格:Data Domain的在线销售系统中DD560的报价为105,000美元。
易用性:当你第一次配置你的网络和一个简单的系统的时候,你可以通过一些终端或者浏览器完成对磁带库的配置,然后通过特殊帐户的权限,你可以设置驱动器的类型和磁带槽位的数量,但必须是通过命令行来配置。虽然这些配置操作不是十分的困难,但你必须十分细心的阅读产品手册并且理解好每个选项的含义。
仿真性能:DD560仿真成StorageTek L180磁带库和IBM LTO-1驱动器。最多可以虚拟成16个驱动器和100,000个槽位。每盘仿真磁带最大可以虚拟成800GB。此外,DD560最多支持仿真成8个虚拟磁带库实体。也就是说,他能够将一个虚拟磁带库虚拟成8个磁带库给不同的主机和介质服务器使用,并且,每一台虚拟磁带库可以通过逻辑单元号屏蔽并限制每台主机的访问。
DD560并不像Quantum的虚拟磁带库那样复杂,Quantum的虚拟磁带库可以仿真成6个不同的磁带库和许多个虚动器,但是,Quantum仿真出来的虚拟磁带库配置起来非常容易,并且非常适合BackupExec备份管理软件的要求,同时对Symantec的企业版备份管理软件NetBackup的支持也有很好的表现。
多主机支持:一个有效的磁带库槽位配置应该包括槽位、介质管理的磁带条形码,以及一个管理员设置备份策略的介质管理池,只要软件能够很好的支持L180磁带库,这些配置信息就可以帮助管理员更好的比对现有的环境要求。Quantum的虚拟磁带库每个光纤接口只支持一个主机,所以,在多主机和介质服务器的并行流备份技术上,Data Domain的虚拟磁带库要好于Quantum的虚拟磁带库。
报告:每一台默认配置的DD560都可以通过基本的邮件方式发送其硬件维护报告给Data Domain技术支持中心,同样,其技术支持中心也能够给本地的系统管理员发送报告,以预警系统环境或者磁盘空间有超出阀值的参数,方便我们的管理。
扩展性:DD560提供了很好的扩展性,还可以增加两个额外的控制器和磁盘扩展架,以增加其容量和系统整体的吞吐量。
Quantum DXi5500详测细节
Quantum的DXi5500采用24块500GB的磁盘,总计裸容量为12TB,可用容量8.17TB。它有4个2Gbps光纤通道接口。
价格:139,000的测试价格里面包含在线的系统安装支持。
仿真:通过BackupExec对两种默认的虚拟磁带库和驱动器类型的测试,我们看到了一些初步的问题。对于不同的磁带库和驱动器类型我们都可以非常简单的去改变仿真磁带库的运行模式,也就是说选择相应的类型以配合BackupExec备份管理软件与备份设备间更好的通讯。同时,我们在运行Java 1.6的GUI图形界面时同样遇到了一些问题,但将其恢复到Java 1.5版本后,问题就解决了。
易用性:整个系统的配置非常简单。通过优良的在线帮助接口,我们可以很简单、很直接的创建磁带库的类型、驱动器、槽位、条形码以及介质池。简单的GUI图形化界面使得在产品配置上比DD560容易得多。
多主机支持:与Data Domain的虚拟磁带库相比,多介质服务器和备份主机的支持多少还显得有些麻烦,因为它的每一个光纤通道接口仅允许连接一台服务器。
服务:DXi5500的价格里包括Quantum的在线安装支持和一年的在线升级包,还有远程监控和诊断服务。这我们在Data Domain的产品中也发现了相似的功能,就是让我们的管理员能够远程诊断和察看软件配置问题。当然这两个特点厂商早已经做过广告了。
重复数据删除实测比拼
通过我们定义的测试方法,DD560设备的第一个全备份所需要的空间为972GB,DXi5500需要957GB,这就表明两种设备备份时的压缩比接近2:1,尽管这和标准磁带驱动器的压缩能力差不多,但两个厂商都对外宣称这是其压缩能力最低表现。
第二次全备份的时候,DD560使用的空间为992GB,而DXi5500需要1001GB。这些微量的增长主要来自于第一次备份到第二次全备份的这个过程中使用了重复数据删除技术,而重复删除技术在处理过程中增加了大量的指向文件的指针,同时也增加了系统的额外开销。
Data Domain的DD560采用的是线内的重复数据删除处理技术,Quantum的DXi5500采用的是后处理技术。后者不等整个备份任务结束就开始重复数据删除的处理过程,他会在备份任务执行10分钟之后开始处理,然后一边执行备份任务,一边执行连续的进行重复数据删除的处理。 网管u家u.bitsCN.com
第三次全备份的时候,DD560需要的空间增加到1006GB,DXi5500需要的空间是1015GB。第三次全备份数据增长量实际上只改变了不到60GB的数据,因为包含于每一个文件的大量数据都是相同的,并且只有每个文件少量的改变量被写到存储中。
总之,如果采用普通的虚拟磁带库或者实际的磁带库,2TB的全备份作三次将产生6TB的数据量,而具备重复数据删除处理能力的这些虚拟磁带库每次只损耗1TB的数据空间。通过每个虚拟磁带库,每个实际大小2TB的全备份其实只占用了相对较少的数据空间,所以对于一个2TB的卷,我们可以支持以月为周期的大量的全备份,周而复始的,最终也就使得这些虚拟磁带库的压缩比达到20:1、30:1、50:1甚至更多。 网管bitscn_com
备份持续速率比拼
我们认为:与其通过虚拟磁带库来限制备份的速度,不如通过服务器的I/O来限制。因为两台不同的虚拟磁带库通过同一个服务器进行测试的持续读写速度是相似的。
采用一台单CPU处理器2.8GHz服务器,2GB缓存的服务器,BackupExec报告的备份速度平均值DXi5500为36.96Mb/s,DD560为35.93Mbps,而采用一台双CPU处理器3.4GHz服务器,3GB缓存的服务器,备份速度平均值DXi5500为56.77Mb/s,DD560为60.35Mbps。
Data Domain设备的性能在我们的恢复测试中稍占上峰,24GB大的文件夹通过DD560恢复需要12分40秒,而DXi5500恢复需要13分05秒。
除了备份这2TB的数据之外,评测机构还通过微软的LoadSim软件模拟出一个高并发负载的环境对Exchange邮件服务器进行反复测试。但不幸的是,通过LoadSim软件没有找到任何一种方法能够改变备份内容的大小,所以事实上从每个邮件服务器备份出来的信息几乎都是相同的。
尽管成千上万的相同的信息经过重复数据删除处理,但在备份数据时两个虚拟磁带库的持续备份速率基本相同。我们测试目的主要是给重复数据删除处理引擎最大的压力,以看到其处理能力的最大程度。因为每一个文件都需要经过重复数据删除处理产生相同的指针,这样每个文件都需要访问另一个为重复数据删除处理建立的数据库,所以为重复数据删除处理建立的数据库随着数据的增加越来越快的增长,并且其性能也不会改变或受到影响。这就表明,对于大量相同文件的重复数据删除处理不会成为系统备份的瓶颈。
对于大量的TB级别的数据,如何减小备份窗口,如何以月为周期更快更简单的存储数据,上述两种产品都可以做到很好。
综合评点:适用才是最好
通过以上各个性能指标的测试,用户可以充分的了解这两款虚拟带库在实际使用中的性能对比。但是我们不能做一个简单机械的总结来告诉你,哪个虚拟磁带库更好,或者说最适合你们的应用环境,因为这需要根据用户具体的应用环境综合考虑。
举个例子,如果你有很多的文件服务器,并且每个用户都有有一些不常变化的根目录,你要存储六个月且每天都做全备份,这就需要你通过一个较小的应用达到一个较高的压缩比率。另一种情况,如果你要备份的时候变化很快的交互性数据库数据,并且需要加密或者彼此间没有太大关系的其他类型数据时,比如视频文件,你就不会有太高的压缩比。
同样,具备重复数据删除处理的虚拟磁带库与我们平时经常使用的标准磁带库之间是对立的。如果你的虚拟磁带库本质上是用来当作一个高度缓存,用来减小备份窗口,然后再备份到磁带库,那其实只是一个D2D2T的环境要求。
并且,这种情况下,数据一旦备份到实际的物理磁带库之后,虚拟磁带库上的备份任务随即删除,那样重复数据删除处理的优势就得不到任何一点的表现。在另一方面,当你每周或每月备份近似相同的数据时,带有重复数据删除处理技术的虚拟磁带库才是你最佳的选择。
阅读(896) | 评论(0) | 转发(0) |