分类: 服务器与存储
2008-06-15 06:19:26
大话存储:浅析即时备份/瞬间容灾恢复技术 持续性数据保护(CDP)是一项新兴的存储技术,自问世以来,在业界内掀起了轩然大波,一时成为热门话题。因为,CDP技术能够捕捉到一切文件级或数据块级别的数据写改动,并提供记录着所有历史数据状态的动态恢复日志,用更加灵活的“任意时间点(any-point-in-time)”恢复方式取代了传统的指定数据库状态恢复到过去的某个时间点的“Point-in-time”恢复方式,为应用数据提供了更全面的保护。 以往,用户只能通过建立镜像的方式来恢复单个文件备份,依照存档日志的记录来同步数据,最后将恢复的数据分段传送到动态的系统环境中,操作过程繁琐而又耗时,也许过不了多久,它就会被另一种更加规范更加简便的恢复方式所取代。比如说,借助持续性数据保护技术来恢复数据库,用户只需将时间点设置在灾难发生前的那一刻,升级CDP数据集,让应用软件紧随着数据的更新来进行复制操作,使得在任意时间点上保存数据成为可能。从理论上来讲,IT经理们将可以彻底摒弃传统的预先设定时间点的备份解决方案,大大节省了人力物力财力和时间,提高了系统管理的效能。 截至目前为止,CDP技术的应用范围还非常狭窄,仅局限于数据库(注:大多数采用CDP技术的企业都是抱着“提高数据库整体容灾恢复水平”的目的)和电子邮件(注:由于Microsoft Exchange的数据恢复操作过于复杂,促使可支持Microsoft Exchange的CDP技术崭露头角)两方面。事实上,这只是牛刀小试,CDP还具备转变应用程序容灾恢复状态的功能,相信不久的将来,该技术一定能够广泛地融入到企业机构的商务运作当中,并获得应有的重视。 现在有许多企业之所以选择部署CDP方案,仅仅只是为了弥补公司现有的数据容灾方案所存在的漏洞,简化其复杂的操作过程。其间可能会牵涉到大型的Microsoft Exchange环境,单单恢复整个数据库就有可能花上三天三夜的时间;也有可能会牵涉到某个控制着多个数据库的高级应用,为了修改系统建立镜像的法则,需要做一番伤筋动骨地调整才行。大多数企业的IT负责人都认为,只要容灾恢复进程的复杂程度能够控制在一定范围之内,只要没有超过即定的临界点,都是可以接受的。所谓的临界点,有可能指的是现行方案存在的技术局限性,也有可能指的是某些复杂的操作已经超出了管理人员的掌控能力,即使勉强完成了恢复进程,得出的数据的可用性也是极低的。 据某知名传媒服务公司的IT负责人透露,他所在的公司目前已购买了一套Mendocino Software的CDP解决方案,用于处理数据库的容灾恢复进程,不过,他们主要倚重的备份软件仍然是Veritas软件公司的NetBackup。Mendocino的CDP软件被当作快速的容灾平台来使用,便于公司的数据库管理员轻易地掌控数据容灾恢复的进程。该公司并没有采用“不挑剔应用”的分离镜像(split-mirror)和快照复制技术来支持业务关键性的数据库容灾容错,因为,它希望数据容灾恢复的过程变得完全透明化,直接受数据库管理员的控制。 此外,我还曾与一家全球知名的营养食品零售集团的IT经理打过交道,他选择了Storactive公司基于硬盘的LiveServ备份/容灾恢复软件方案来为其所在公司关键业务的 Microsoft Exchange电子邮件服务器提供了连续的零损失数据保护。之所以选择LiveServ,主要是因为它能够在Exchange数据库恢复进程中赋予用户更高层次的应用级别的控制权力。Storactive能够在数分钟内,甚至数秒钟内,即可将对象级别的电子邮件恢复到某一时间点的状态,耗时极少。这对于该公司而言可谓是一大进步,以前每次系统发生故障时,工作人员都需要花上数天的时间,才能找回损耗的数据。 更重要的是,通过应用CDP技术,大大简化了数据容灾恢复的操作步骤,减轻了存储管理部门的负担,为企业用户提供更快捷的增量备份服务。另外,该公司依然保留了之前一直在使用的Veritas NetBackup备份/容灾恢复解决方案,只不过将应用型数据的容灾恢复任务完全移交给Storactive了。 另外,我还知道有一家医疗管理机构采用的是Revivio公司研制的持续性保护系统(CPS)解决方案,主要为数个Oracle数据库及Microsoft SQL Server服务器提供保护,该系统上存放的数据量目前已超到了100TB。据该公司的IT负责人介绍,他们之所以选择Revivio的产品,主要是因为该公司现有的热备份系统架构经常出故障,三天两头就会发生系统崩溃。自从部署了CPS之后,移动备份文件镜像的操作过程大为简化,方便了数据库管理员更好地控制整个恢复进程,该公司的IT部门长久以来梦寐以求的愿望一夜之间就实现了。 应用级的容灾恢复解决方案需要具备以下三大基本要素: • 以应用为中心的容灾恢复。整个容灾恢复进程将由该应用程序全程跟进和控制,能够将数据库恢复到自该方案实施之后的任意时间点的状态。 • 尽量减少人力干预。除应用程序之外的所有基础架构的调整,均由CDP软件自动完成,不需要或尽量减少人力干预。 • 基于事务的容灾恢复。很多经理级的人员都应该具备这样的素质,能够从一个或者多个应用程序的恢复操作中,清晰地了解和判断出它所代表的商业价值。有一些事务是阶段性的,每隔一段时间就会发生一次,比如说“季度结算”和“升级CRM软件”;有一些是一次性的,比如说“将新购买的服务器接入网络当中”;此外,还有一些事务的动静比较大,牵涉面比较广,比如说“系统整合前的准备工作/系统整合后的收尾工作”。 在评估各家厂商提供的CDP产品时,一定要结合本企业实际的应用环境。我们整理出用户们在评估CDP是否适合本企业需求时经常会遇到的一些问题,提出来与大家共享。 你目前所使用的应用程序是否经常掉线?因此而引起的系统死机故障是否仍处于你的掌控之中,并不会影响到企业的正常运作? 如果你的答案是“是”,那么,就不需要采用CDP技术来保护该应用程序了。普通的快照复制工具和镜像工具已具备足够强大的基于磁盘的容灾容错能力,部署CDP方案纯属多余。 该应用程序在灾难发生后,恢复运转时数据丢失的可容忍程度为多高?是以天、小时、分钟,还是以秒来计算?在过去的一年当中,贵公司所制定的数据恢复点目标(RPO)是什么? 如果你是以分钟(或更小的时间单位)来计算该应用程序的数据损耗的话,那么,部署CDP方案或许是不错的选择,能帮助你更加轻松地完成RPO目标;如果你可以忍受数小时(或更大的时间单位)的数据损耗的话,那么,使用CDP来保护该应用程序就没有多大的必要了。 对于该应用程序从灾难发生到恢复正常运转所需要的时间,你的可容忍程序为多高? 如果你的回答是“一刻都不能容忍”,或是你希望系统环境的可靠性维持在five-nines (99.999%)左右,那么,不妨借助CDP技术来改善该应用程序的数据恢复点目标(RPO),不过,对于由此引发的投资及回报,事先一定要分析清楚,权衡利弊得失。 该应用程序的容错容灾率是否维持在两位数以内?企业现有的容灾恢复解决方案是否需要大量的人力干预?日常的存储行为(如配置存储资源)是否会影响到该应用程序的正常运行? 如果你的回答是肯定的,那说明企业现有的容灾恢复方案实在过于复杂了,你应该考虑引入CDP技术。复杂的应用环境常常会引发许多间接开支。而CDP最大的好处之一就是它能够简化复杂的操作步骤,化零为整,将离散的系统活动整合在一起(比如说,传统的热备份解决方法是将多个独立的备份镜像进行同步,而CDP则是提供单一的用户特定的数据库恢复镜像文件)。 如果你已经下定决心要购买一款CDP产品了,那么,你还需要多考虑一个问题:不同类型的CDP产品适合于用来保护哪些应用程序?比如说,跨越不同平台的多个数据库应用程序与Exchange邮件服务器,所需要的CDP产品是完全不同的。 为了帮助用户缩小选择的范围,我们将时下的CDP产品分成了多平台(multiplatform)、中央平台(platform-centric)和指定应用(application-specific)等3大类。 多平台的CDP产品(Multiplatform) 多平台CDP产品的供应商目前以Mendocino Software和Revivio两家为主,其推出的CDP产品采用的是从企业内部的需求入手的“由下至上(bottom-up approach)”策略。供应商的目标是研制一套基于数据块的CDP引擎,它具有较高的适应性,能够支持所有主流的操作平台及应用程序。这一类产品适合于那些拥有庞大的业务关键性的数据库系统——特别是跨越多个操作平台的数据库系统——的企业机构。 中央平台的CDP产品(Platform-centric) 这一类产品的供应商目前以TimeSpring Software和XOsoft两家为主,它们潜力研制适合于Windows平台的CDP技术,可支持微软推出一系列应用程序,比如说Windows文件服务器、SQL Server和Exchange。中央平台的CDP产品适合于那些希望通过单一的技术平台来管理所有应用程序的用户。 此外,这类产品还适合于那些希望在公司内部部署一套成本相对低廉的应用程序容灾恢复解决方案的中型企业用户。 指定应用的CDP产品(Application-specific) 中央平台的CDP产品是专门针对一种操作系统开发的,而指定应用的CDP产品则是围绕着实现与某一种应用程序的深度集成而研制的,针对的范围更加狭窄。目前,市面上出售的指定应用的CDP解决方案,大多是针对Microsoft Exchange应用而开发的,主要的供应商包括FilesX Inc.、Mimosa Systems Inc.和Storactive。 是实施数据块级别的保护?还是文件级的保护? 如果实施数据块级别的保护方案,一切受CDP应用程序保护的数据,其写入的方式都与传统的卷管理器(volume manager)差不多。无论捕捉数据的操作是在服务器上发生,还是在网络设备中进行,应用程序将会实时更新数据所做的一切修改,记录下数据的最新状态。因为块级数据不受文件级别语义的限制,所以,块级数据保护方案能够捕捉到所有类型的数据:结构型、半结构型和非结构型。至于数据的容灾恢复,块级数据保护方案将会根据应用程序的要求——数据库表格和行记录、电子邮件项目、邮箱,等等——来创建“恢复目标”。不过,块级数据保护方案是无法自动恢复文件级的信息数据的,因为这其中牵涉到了与文件系统的兼容问题。如果是针对数据库应用程序的容灾容错,CDP技术供应商们多倾向于采用块级数据捕捉系统。 文件级CDP产品是针对特定应用程序——比如说SQL Server或Exchange——的扩展功能而设计的。此类产品可将数据直接还原至文件级别,藉此实现与高级别应用更紧密的交融,因为,实体存储层与逻辑存储层之间的沟通不存在任何障碍,它们是一体的,而这恰恰正是数据块级CDP产品所无法克服的“瓶颈”。如果用户希望跨越多个平台实现持继性数据保护的话,那么,就只能选择基于块级方案的CDP应用软件啦。 展望CDP发展前景 目前市面上发售的CDP产品,或多或少都能提供一定的应用程序容灾恢复功能,具体视其与受支持的应用程序的兼容程度而定。相信在未来的18个月中,大多数CDP产品在架构方面存在的差异将会变得越来越模糊。多平台存储供应商们将会推出一系列特定应用的功能模块及集成工具,进一步强化跨关键应用的支持功能。与此同时,以开发针对性应用程序持续性数据保护产品为主的存储厂商将会继续引入各种自动化处理技术,推进其产品与商务流程的融合。 如果再将目光放远一点,三年之后,CDP技术将会发展成为一门新兴的关于应用容灾恢复的综合学科。最终,凌驾于数据库之上的高级别应用(例如企业资源规划工具、客户关系管理工具、基于网络的服务,等等)将会提供一系列的自我修复(或自我还原)功能,不需要与存储层发生直接接触。按照这种趋势发展下去,终有一天应用程序将能够主动诊断系统故障,并自行采取修复办法,不需要人力干预。 可以预见的是,全球领先的软件开发商们——比如说微软,甲骨文(Oracle)、SAP AG,等等——将会纷纷开放应用程序编程接口(API),或推出相应的软件套件,向基于CDP技术的容灾恢复方案靠拢。CDP技术将与应用软件直接交互,共同谱写数据信息容灾恢复的美好乐章。 |