2008年(8065)
分类: 服务器与存储
2008-11-25 11:49:57
异地备份
将数据在另外的地方实时产生一份可用的副本,此副本的使用不需要做数据恢复,可以将副本立即投入使用。这就是异地备份。
异地备份的数据复制目前有如下实现方式:
基于主机。基于主机的数据复制技术,可以不考虑存储系统的同构问题,只要保持主机是相同的操作系统即可,而目前也存在支持异构主机之间的数据复制软件,如BakBone NetVault Replicator就可以支持异构服务器之间的数据复制,可以支持跨越广域网的远程实时复制。缺点是需要占用一点主机资源。
基于存储系统。利用存储系统提供的数据复制软件,复制的数据流通过存储系统之间传递,和主机无关。这种方式的优势是数据复制不占用主机资源,不足之处是需要灾备中心的存储系统和生产中心的存储系统有严格的兼容性要求,一般需要来自同一个厂家的存储系统,这样对用户的灾备中心的存储系统的选型带来了限制。
基于光纤交换机。这项技术正在发展中,利用光纤交换机的新功能,或者利用管理软件控制光纤交换机,对存储系统进行虚拟化,然后管理软件对管理的虚拟存储池进行卷管理、卷复制、卷镜像等技术,来实现数据的远程复制。比较典型的有Storag-age,Falcon等。
基于应用的数据复制。这项技术有一定局限性,都是针对具体的应用。主要利用数据库自身提供的复制模块来完成,比如OracleDataGuard,Sybase Replication 等。
灾难备份解决方案的分析及选择
在推行计算机应用的过程中,银行已深深体会到系统可用性对银行业务的重要性。在保证到本地机房的高可用性之外,他们还认识到:对于意外引起的包括自然灾害、设备损毁等灾难性事件,仍然需要有相应的保护措施,以保障业务系统的连续运行,从而获得良好的企业形象,保证社会的正常金融秩序。
事实上,对灾难进行预防建设是危机管理的一部分。据一项美国的研究报告显示,在灾害之后,如果无法在14 天内恢复资讯作业,有75%的公司业务会完全停顿,43%再也无法重新开业,因而有20%的企业在两年之内被迫宣告破产。另一方面,对于灾害所造成的冲击分析显示,各行业最长可忍受的信息系统停机时间分别为:金融业-2天;销售业-3.3天;制造业-4.9 天;保险业-5.6天。平均来看,一般行业可忍受的信息系统停机时间为4.8天(资料来源:美国明尼苏达大学)。如果以营业收入的损失来看,金融业所遭受的损失最严重,可高达每日营业收入的50%。
由此可见,金融业对于信息技术的依赖程度尤其甚于其它行业,更难以容忍因为电脑中心停止服务所造成的惨重损失。同时,灾难备份的实现并非单纯的技术问题,其所涉及的将会是整个企业体所可能遭遇的问题,因而大多数的企业决策者都意识到灾难备份计划对企业的重要性。
灾难备份计划要求有周详的事前准备,尤其是需要分析灾难对业务的冲击程度并相应制定灾难后的恢复策略,同时配合目前最新的信息技术,提出最佳的恢复方案。在系统备份计划建立以后,还必须在事前反复测试,并随时调整、加以改进,完整的灾难备份解决方案才得以建立。
据国际标准SHARE 78 的定义,灾难备份解决方案可根据以下列出的主要考虑方面所达到的程度而分为七级,从低到高有七种不同层次的对应的灾难备份解决方案。银行的金融监管系统可根据数据的重要性以及需要恢复的速度和程度,来设计选择并实现灾难恢复计划。
· 备份/恢复的范围
· 灾难备份计划的状态
· 生产中心与备份中心之间的距离
· 生产中心与备份中心之间是如何相互连接的
· 数据是怎样在两个中心之间传送的
· 允许有多少数据被丢失
· 怎样保证更新的数据在备份中心被更新
· 备份中心可以开始备份工作的能力
在1992年Anaheim的SHARE 78, M028这一会议报告中, 自动的异地远程恢复任务被定义有七种层次:
1. 无异地数据备份(No off-site Data)
被定义为没有信息存储的需求,没有建立备份硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复, 没有数据送往异地。这种方式是最为低成本的灾难备份解决方案,但事实上这种灾难备份并没有真正灾难备份的能力,因为它的数据并没有被送往远离本地的地方,而数据的恢复也仅是利用本地的记录。
2. PTAM车辆转送方式( Pickup Truck Access Method)
灾难备份方案需要设计一个应急方案,能够备份所需要的信息并将它存储在异地,然后根据灾难备份的具体需求,有选择地建立备份平台, 但事先并不提供数据处理的硬件平台。
PTAM是一种用于许多中心备份的标准方式,数据在完成写操作之后,将会被送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,一整套系统和应用安装动作需要在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难备份方案相对来说成本较低(仅仅需要传输工具的消耗以及存储设备的消耗)。 但同时有难于管理的问题,即很难知道什么样的数据在什么样的地方。一旦系统可以工作,标准的做法是首先恢复关键应用,其余的应用根据需要恢复。这样的情况下,恢复是可能的,但需要一定的时间,同时依赖于什么时候硬件平台能够被提供准备好。
3. PTAM卡车转送方式+热备份中心 (PTAM+Hot Site)
相当于是Tier 1再加上具有热备份能力中心的灾难备份。热备份中心拥有足够的硬件和网络设备去支持关键应用的安装需求。对于十分关键的应用,在灾难发生的同时,必须在异地有正运行着的硬件平台提供支持。这种灾难备份的方式依赖于用PTAM的方法去将日常数据放在异地存储,当灾难发生的时候,数据再被移动到一个热备份的中心。虽然移动数据到一个热备份中心增加了成本,但却明显降低了灾难备份的时间。
4. 电子传送(Electronic Vaulting)
是在Tier 2的基础上用电子链路取代了车辆进行数据传送的灾难备份。接收方的硬件平台必须与生产中心物理地相分离,在灾难发生后,存储的数据用于灾难备份。由于热备份中心要保持持续运行,因此增加了成本。但确实是消除了运送工具的需要,提高了灾难备份的速度。
5. 活动状态的备份中心 (Active Secondary Site)
这种灾难备份要求两个中心同时处于活动状态并管理彼此的备份数据,允许备份行动在任何一个方向发生。接收方硬件平台必须保证与另一方平台物理地相分离,在这种情况下,工作负载可以在两个中心之间被分担,两个中心之间之间彼此备份。在两个中心之间,彼此的在线关键数据的拷贝不停地相互传送着。在灾难发生时,需要的关键数据通过网络可迅速恢复,通过网络的切换,关键应用的恢复时间也可降低到了小时级。
6. 两中心两阶段确认 (Two-Site Two-Phase Commit)
是在Tier 4的基础上在镜像状态上管理着被选择的数据 (根据单一commit范围,在本地和远程数据库中同时更新着数据),也就是说,在更新请求被认为是满意之前,Tier 5需要生产中心与备份中心的数据都被更新。我们可以想象这样一种情景,数据在两个中心之间相互映像,由远程two-phase commit来同步,因为关键应用使用了双重在线存储,所以在灾难发生时,仅仅传送中的数据被丢失,恢复的时间被降低到了小时级。
7. 零数据丢失 (Zero Data Loss)
可以实现零数据丢失率,同时保证数据立即自动地被传输到备份中心。Tier 6被认为是灾难备份的最高的级别,在本地和远程的所有数据被更新的同时,利用了双重在线存储和完全的网络切换能力。Tier 6是灾难备份中最昂贵的方式,也是速度最快的恢复方式,恢复的时间被降低到了分钟级。对于Tier 6 的灾难备份解决方案,可以应用两种远程拷贝技术来实现,即PPRC同步远程拷贝和XRC异步远程拷贝。