分类: 服务器与存储
2008-06-22 15:37:47
从广义上讲,任何提高系统可用性的努力,都可称之为容灾。
平时讲到的容灾,一般都是远程容灾,远程容灾可以这样理解,在各种企业的IT系统中,必然有一部分(尤其核心部分)是非常重要的,我们叫它
|
生产中心。人们往往给生产中心配备一个备份中心,该备份中心是远程的,并且已经实施了各种各样的数据保护。
公司提供了两种不同层面的容灾方案,即数据级和应用级的灾难备份解决方案。数据级容灾方案采用基于ESS企业存储服务器的PPRC(Peer to Peer Remote Copy)复制技术;应用级容灾方案采用基于IBM RS/6000服务器的HAGEO(High Availability Geogrhic Cluster)异地群集技术。这两种方案均能够保证数据的一致性和可靠性,又具有不同的特点。
数据级灾备——PPRC
PPRC是以存储为基础的、实时的、同步的、与应用无关的数据远程镜像功能。PPRC实现较为简单,是无数据丢失且具有完全恢复功能的的灾难恢复解决方案。PPRC基于IBM ESS企业存储服务器,通过ESCON通道,以逻辑卷为基本单位,将本地ESS上的数据同步镜像到远端ESS上。为了保证数据的即时性、完整性和系统性能之间的平衡,PPRC提供了多种工作方式,其中包括同步PPRC和异步PPRC。
在同步方式下,PPRC将确保如果备份卷不能被更新,那么即使源卷更新成功,整个写操作也会返回失败——彻底保证源卷和目的卷的数据一致; 同步方式可以保证数据不丢失,更重要的是数据的一致性在这种方式下能够得到很好的保证——数据的不一致意味着相关数据的丢失,此时的数据安全机制无法保证数据的安全,严重时还可能造成数据库无法启动。
在异步工作方式下,PPRC能够在远端更新未完成的情况下,通过本地更新成功向主机返回“写成功”信号。其好处是: 在主备机房之间数据链路带宽成为瓶颈时,采用异步方式可以不影响主机房生产系统的性能; 坏处是: 数据将有可能丢失。所以当采用异步方式时,IBM建议先采用IBM ESS的快速拷贝功能“FlashCopy”,备份需同步的数据,再进行数据同步。
PPRC在初始连接时需要建立逻辑卷连接,之后PPRC会自动同步该逻辑卷。利用此项功能,可以进行ESS之间的数据迁移(PPRC的同步实现机制如图1所示)。
① 应用程序将数据写入磁盘,在生产系统中的应用程序将数据写到生产系统的磁盘;
② 生产系统中的磁盘数据传输到备份的磁盘,每一个在生产系统的写操作都要将这个写操作送到备份磁盘;
③ 备份磁盘复制生产系统数据;
④ 将写完操作信息返给生产磁盘,当生产系统收到备份系统传回的已写信息之后,生产机磁盘系统通知主机该写操作已完毕,生产系统应用继续执行。
在标准的实时备份方案中,主机等服务器通过与IBM企业存储服务器ESS相连接,两台ESS之间通过ESCON通道实现同步远程拷贝。受ESCON传输距离的限制,当主备机房的距离超过2公里时,需要加光纤延伸器。光纤延伸器可以从多个不同的厂商购得,比如IBM 2029 Fibre Saver、INRANGE的9801等。在光纤延伸器的帮助下,PPRC可以达到103公里的距离。
应用级灾备——HAGEO
计划一个灾难备份方案,主要考虑数据的备份方式和备份中心的运行模式。IBM HAGEO方案是一种数据热备份/热备份中心的方案。
数据热备份 在每一个交易中,本地生产环境和远程备份中心的数据都同时(异步或同步)进行更新,以保障本地和远程数据的实时一致性,实现最快的灾难恢复。交易的用户响应时间将受到远程网络的带宽影响;
热备份中心 完整的机房设施和电脑系统,处于待命状态,与生产中心同时(实时或定期)进行数据更新,以保证最迅速的系统灾难恢复。
HAGEO提供了目前基于RS/6000平台的灾难备份功能。在HAGEO环境中,每个交易或任务完成之前,系统都会通过远程网络,先完成生产系统和备份系统的数据更新,保障数据实时一致性;并且,象HACMP双机备份一样,提供故障检测和自动实时恢复功能。
HACMP是IBM RS/6000平台上的高可用软件。它解决了本地多个服务器之间的互相备份问题。HAGEO将HACMP的功能在地理位置上作了延伸,将HACMP的优势扩展到广域网上,从而提供了一个很好的远程备份解决方案。
IBM HAGEO容灾方案的基本设想是:生产环境是两台RS/6000服务器,组成一个本地的双机热备环境。当本地的一台服务器发生故障时,应用会自动切换到本地另外一台服务器上。在备份地点,由一台RS/6000服务器作为备份服务器。当生产环境中的两台服务器都不能工作时,备份地点的服务器自动启动应用,恢复正常的生产环境(HAGEO逻辑结构如图2所示)。
连接两地的网络带宽应大于2MB。如果应用对I/O的写请求很多,应提高网络带宽,以保证系统的整体性能不受影响。客户端如何访问服务器也是在做方案时需要考虑的一个重要因素。HAGEO只能负责到(服务器)系统这一层,在灾难发生后,客户端如何访问备份中心,这一点需要在网络整体设计时加以考虑。
IBM:实现整合全面容灾
亮点:IBM容灾方案是本专题中较完善的方案,它关注从数据级到应用级的全面备份。IBM公司基于其PPRC复制技术和服务器HAGEO异地群集技术,提供了数据级和应用级两种不同的灾难备份解决方案。PPRC基于IBM ESS企业存储服务器数据同步镜像技术,在存储设备之间实现同步或异步远程备份,有效地保障了系统数据的安全。
HAGEO应用级容灾方案基于IBM RS/6000服务器,利用RS/6000平台的高可用软件HACMP,并将HACMP的功能在地理位置上作了延伸,将HACMP的优势扩展到广域网上,该方案的优点包括:
● 支持数据在两个不同地点之间实时镜像,距离不受限制;
● 支持所有数据库和文件类型,对应用程序透明;
● 基于TCP/IP网络;
● 提供同步(SYNC)、镜像写一致(MWC)、异步(ASYNC)三种数据镜像模式;
● 保证两地数据的一致性;
● 灾难发生时,在备份地点自动恢复应用;
● 集成于HACMP和AIX,提供错误检测手段。
不足:数据级容灾方案(PPRC)通过ESCON通道实现两台存储服务器之间的同步远程拷贝,但是ESCON所支持的传输距离仅限于2公里左右,当主备机房的距离超过2公里时,需要加光纤延伸器,因此这种容灾方案在长距离备份的情况下,投资较大,而且数据的传输性能也将受到一定影响。
相关链接:不同的备份模式
所谓远程容灾备份是为了防范生产中心现场整体发生瘫痪故障,备份中心以适当方式接管工作,从而保证业务连续性。目前,远程容灾数据备份的主要方式有“冷备份”和“热备份”。
冷备份方式:冷备份方式是指数据通过磁带等较慢的介质从生产中心备份后,送到备份(backup)中心并恢复 (restore)。由于早期没有好的方案来解决生产中心和备份中心之间的数据同步问题,因此这种方式的致命弱点是备份中心的数据存在较长延迟,不同步,一旦故障发生,恢复过程除最新磁带备份数据恢复外,还对最后备份时间以后的交易数据根据凭证进行输入。一方面整个过程耗时较长,另一方面,万一凭证也随主现场一同丢失,则事实上无法实现完备的恢复。
热备份方式:热备份方式是指备份中心与生产中心之间的数据,通过适当解决方案确保其实时传递,当生产中心现场整体发生瘫痪故障时,备份中心能迅速切换为生产系统,以保证业务连续性。热备份方式的关键点在于数据备份的实时性,是关键业务所需的容灾方案。目前国内外大多数银行、电信用户都转向热备份方式。