Chinaunix首页 | 论坛 | 博客
  • 博客访问: 31647897
  • 博文数量: 409
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 5040
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-28 21:09
文章分类

全部博文(409)

文章存档

2011年(1)

2008年(408)

我的朋友

分类: 服务器与存储

2008-07-31 12:27:29

应用篇:VTL担当灾难恢复重任

  银行应用高效节约

  国内某知名银行在当今众多的新型备份技术和设备中,进行了严格测试和筛选,最终选择了Sepaton有限公司的S2100-ES2虚拟磁带库和VERITASNetBackup备份软件来组建一个先进、快速、稳定、安全的备份系统。

  该解决方案将备份作业切分为两个部分:第一部分利用快速的虚拟磁带库设备在Veritas软件的控制下进行数据备份,在规定的时间内,按照用户要求快速完成将数据备份;第二部分仍然在Veritas软件控制下,针对已完成备份的数据中需要进行长时间保存的数据,利用Vault功能,在不占用业务主机资源的情况下,运用虚拟磁带库匹配物理磁带库进行数据复制,做离线保存。数据恢复作业同样分为两个部分:从虚拟磁带库做快速恢复,从物理磁库做离线数据恢复。

  采用本方案后,根据用户现场实测,在SepatonS2100-ES2和VERITASNetBackup配合使用的情况下,备份DB2数据库120GB数据,使用单数据流、单个虚拟磁带驱动器进行备份,20分钟内即完成备份,平均速度在100MBps。在并发数据流和多虚拟驱动器并发工作时,按照用户要求,在3.5小时内完成多个数据库的,数据总量超过4TB的数据备份(其中有一个数据库的数据就有3TB),以及超过2.5TB的报文数据备份。由于采用ES2的综合全量备份功能,大大削减了直接生成新全量备份、由增量备份和原有全量备份生成合成全量备份所需的时间,节约了存储容量资源,并使得VeritasNetBackup新的合成备份更加有效率。ES2基于内容的压缩功能用户的文件系统按照1:21的比例进行压缩备份,大大节约了存储空间。

  VTL替代原有磁带

  美国Citigroup与StateStreet的合资企业CitiStreet是美国最大的保险福利提供商和退休计划记录管理机构之一。该公司为900多万退休计划参与者提供服务。总部设在马萨诸塞州Quincy市的CitiStreet使用安装在佛罗里达州Jacksonville市数据中心的35TBSepatonS2100-ES2虚拟磁带库已经有一年多时间了,并且正在向其Quincy数据中心安装一台40TB的虚拟磁带库。CitiStreet系统集成经理JeffMachols说,公司将淘汰两个老迈的QuantumATL磁带库设备,每个磁带库包含4台DLT7000磁带机。到那时,VTL将使两个数据中心可以相互提供快速的灾难恢复。Machols最近就使用虚拟磁带库方面的几个问题进行了探讨。

  问:是什么促使你们采用虚拟磁带库?

  答:Quantum设备开始显示老迈之态,并且随着法规遵从性走到前台,符合遵从性审计的安全性开始成为一个重要问题。此外,我们当时要在晚上进行很多批处理工作,因此我们必须缩小备份窗口时间,因为备份占我们批处理的很大一部分。每条备份批处理流都要花上1~3个小时,而且每个客户都有自己的批处理周期。

  我们使用的QuantumATL已经使用5到7年了。更重要的是,这种存储设备开始老化,但是我们不想购买数百盘磁带,因此合理的选择是开始寻找其它解决方案。

  问:你们当时知道你们需要虚拟磁带吗?

  答:最初,我们打算更新我们的磁带库硬件。大约3年前,我们头一次看到了VTL。不过它们当时还没能成为主流产品,并且市场上的产品比较少,而且不具有真正的可伸缩性。从软件和它们的路线图上看,它们并不先进。不过,当我们开始认真考虑取代Quantum磁带库时,市场上出现了更多的企业级系统。

  我们研究了传统的磁带备份,还有像NAS和虚拟磁带这类技术。网络连接存储会改变我们的备份流程、软件、脚本,因为它是一种完全不同的存储技术。虚拟磁带可以仿真磁带库。因此,我们不必修改任何软件或更新我们任何的备份或恢复流程——我们的备份软件以及备份和恢复脚本。

  问:VTL使你们可以更快地进行备份了吗?

  答:非常快。我们的备份速度从平均每秒2MB~3MB增加到了超过每秒30MB。

  问:虚拟磁带被称为是一种低价备份技术。对于你们来说,是这样吗?

  答:当你购买实际的存储库、硬盘和磁带媒介时,虚拟磁带的每兆字节的成本大体相同。以大体相同的费用,我们可以得到10倍的性能以及未来软件功能的额外好处。

  问:虚拟磁带库为你提供了物理磁带不能提供的哪些功能?

  答:最主要的功能是设备级复制。Sepaton能够与另一台Sepaton通信,克隆保存在整个设备上的数据。它为我们提供了一条通过加密的专用线路传送数据的安全方式,而这正是我们进行灾难恢复时所采用的方式。这比使用第三方磁带存储厂商,把我们的存储介质拿到站外保存要有效得多。此外,它还提供了另一个减少我们所需物理空间的内容感知功能。Sepaton使用某种类型的压缩技术和增量保存技术,知道这些数据与昨天的数据是相同的,只备份新数据,因此减少了我们需要的存储容量,从而也减少了费用。

  问:一旦确定你们需要虚拟磁带后,你们是如何确定系统要求的?

  答:我们进行深入的调查。当你研究各种不同的产品时,实际上它们都是SATA连接硬盘。因此,本质上,它们基本上是相同的。对我来说,每秒I/O存取时间2%到5%的差异并不重要。我之所以看上Sepaton是它在复制、减少存储容量的内容感知备份等这些方面领先于其它产品。同时,当你涉及一项全新的技术时,一家年轻的厂商具有吸引力,因为它关注新的备份和恢复范例。

编看编想 制约VTL快速发展两因素

  关于磁带与磁盘的争论已经出现了好多年,直到目前还没有停息。VTL的出现让用户眼前一亮,它结合了磁带与磁盘的优点,按照某些VTL厂商的观点,VTL应该很快占领数据备份的广阔领地。然而,这样的情况并没有发生,笔者认为主要有两类因素制约了VTL的快速应用与普及。

  其一是用户需求。传统磁带/磁带库在备份/恢复工作中遇到的各类困扰,每个用户都十分清楚。关键在于,对于大多数用户来说,这些困扰还没有达到影响用户核心应用的地方,况且,一般来说备份数据都是次要的离线数据,即使出现了丢失的情况,都可以在线下慢慢解决。换句话说,用户对VTL的需求都存在,但是还没有迫切到非得采用的地步。因此,目前部署VTL的用户大多还是对备份工作要求高的电信、金融用户。

  另一因素是VTL的功能。目前用户使用VTL的功能还限制在模拟机械磁带库的范畴,这对广大用户的吸引力还比较有限。如果VTL能够在短期内实现曾经承诺的一些新功能,情况就会出现转机。重复数据删除技术就是一个很好的例子,尽管VTL的在线属性制约其独立使用(还必须与磁带配合使用),但是采用重复数据删除技术从理论上减少了磁带介质的使用。

  VTL的应用会越来越多,这是一种趋势,而用户需求的不断提高以及VTL自身在功能方面的不断完善,则会大大加速这个过程。

  相关链接一 重复数据删除的五个阶段

  1数据收集

  在数据收集阶段,软件通过比较进入的备份数据和先前的备份缩小需要进行分析数据的范围,使用“内容已知”数据库辨别它们之间可能的重复和相似数据。例如,如果名为同一个客户端中的“\root\documents\abc.txt”文件在备份中存在两次,软件自动决定采取何种动作。如果进入的数据是已存在数据的修改版本,该数据就进入下一阶段(数据识别、数据比较)的处理流程以确定数据发生的具体变化;如果进入的数据和已存在数据完全相同,那么进入下一阶段对数据副本进行校验。另外的数据收集操作包括:标志保存在不同位置(例如,不同的客户端、目录等)的相同对象副本。软件还为数据收集阶段发现的冗余数据对创建一工作列表,该表格用于数据识别和比较阶段进行进一步分析。

  2数据识别/数据比较

  在数据识别/数据比较阶段,软件以字节为单位分析数据收集阶段标志出的相似数据对象。如果数据收集阶段创建的工作表表明需要进行数据识别,那么软件就会用delta差分算法确定备份组中的哪些数据是唯一的、哪些数据是重复的。

  该算法可以有效地以字节为单位映射发生变化的数据,并且对数据对象内的偏移或者位置改变不敏感,所以,即使相关的对象之间发生明显的结构改变,该算法仍可以定位冗余的数据。

  如果数据收集阶段从元数据级别认定备份组中的数据和前一个备份相同,那么在数据识别阶段将以字节为单位对数据进行比较。在该步骤中,软件调用数据比较器识别出数据发生变化的文件。

  3数据重组

  数据识别/数据比较的结果被传递给数据重组过程,在该过程中数据被重新组装,放入临时的“保留磁带”中,新数据被保存,前一阶段被标出的重复数据被已存数据的指针替代。对备份软件而言,保留磁带和真正的磁带完全相同,只是存储在新磁带中的数据要远少于真正的磁带上存储的数据。从备份软件看来,数据是连续的并且也没有删除副本,软件可以根据嵌入在文件系统中的指针读取重复数据的唯一一份副本。该过程的最终结果是产生一份经过重复数据删除的备份组视图。

  4可选的完整性检查

  在实际删除所有的重复数据前,软件执行一次可选的检查,以保证数据100%的完整性。在本阶段中,软件通过将“保留磁带”(代表经过重复数据删除的数据)和原始数据进行比较验证其结构和整个数据内容。

  5空间回收

  在空间回收阶段,软件从文件系统中删除冗余的数据,释放先前被占用的磁盘空间以备他用。保留磁带和原始的、没有经过重复数据删除的磁带交换位置(比如条码、槽位以及属性等),然后软件智能的释放重复的区块并将它们放回空闲空间池。经过这样的处理以后,所有其他需要存储空间的数据处理过程都可以重用先前被重复数据占用的空间。

  相关链接二 CitiStreet更新的备份/恢复系统

  ■两个数据中心拥有约100TB的数据

  ■一台35TB的SepatonS2100-ES2虚拟磁带库运行在一个数据中心的HP-UX环境中

  ■另一台40TB的Sepaton虚拟磁带库正在第二个数据中心部署

  ■ES2在大约4小时内备份700GB数据,而在部署VTL之前大约需要24至30小时

阅读(425) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~