分类: 服务器与存储
2008-06-22 17:03:30
针对不同的用户需求,IBM公司的异地容灾方案产品线非常丰富,各种数据备份技术和应用方案层出不穷,处于全球领先地位。它的这些容灾方案不可能全在本文中介绍清楚,所以只选三个常见的方案类型向大家介绍。
一、数据级灾备——PPRC
IBM的PPRC(Peer to Peer Remote Copy,点对占点远程复制)复制技术是基于ESS企业级数据存储,通过ESCON(Enterprise Systems Connection,企业管理系统连接,是一种光纤通道)通道建立配对的逻辑卷容灾技术。这是IBM的最高级别容灾方案,主要适用于大、中型和电信企业选用。它的网络结构(如图1所示)。
图1(点击看大图) |
在图中数据中心A和数据中心B可以是两相隔上百公里的网络系统,既可以单独把某个数据中心的数据备份到另一个远程数据中心中,也可以实现相互远程备份。
在标准的实时备份方案中,主机通过SAN与IBM企业存储服务器ESS相连接,两台ESS之间通过ESCON通道实现同步远程拷贝。受ESCON传输距离的限制,当主、备机房的距离超过2公里时,需要加光纤延伸器。光纤延伸器可以从多个不同的厂商购得,比如IBM 2029 Fibre Saver、INRANGE的9801等。在光纤延伸器的帮助下,PPRC数据备份可达到100公里以上。
在这种容灾方案中,核心设备就是IBM的ESS的企业级存储服务器,目前最新的型号主要有IBM TotalStorage Enterprise Storage Server (ESS) Model 750/800这两种,(如图2所示)。
图2 |
ESS 800型企业级存储服务器支持IBM的多种、UNIX、NetWare等服务器平台之间的存储共享,通过双RISC架构SMP处理器、大容量高速缓存和串行磁盘连接提供出众的性能;使用冗余的硬件、镜像映射的写高速缓存和RAID-5及RAID-10级别的磁盘阵列技术保护支持关键业务应用程序的高可用性。对通过ESCON、FICON、光纤通道、2GB光纤通道/FICON或Ultra SCSI连接的主机支持快速率的数据传输;通过Web浏览器、CLI(命令行界面)或者通过使用ESS API来提供高效、集中的操作管理;使拥有不同种类主机的企业不仅能升至55.9TB的物理磁盘容量,同时能保持最优性能。
对于这种方案中可能用到的SAN机在前面已有了这方面的产品介绍,在此不再赘述。不过要注意的是,在IBM的这些容灾方案中都要求全套设备最好采用IBM自己的,所以在这种容灾方案中的SAN机也需要选择IBM自己的。在IBM中提供多种不同档次的SAN交换机产品,如F08/16/32、M12等机型,可以全面满足各类企业需求。
PPRC容灾方案能够自动将源卷上的数据同步到目标卷,实现以存储为基础的、实时的、与应用无关的数据远程镜像功能,可根据需要选择同步或异步方式。PPRC实现较为简单,纯粹基于硬件,是无数据丢失且具有完全恢复功能的灾难恢复解决方案,需要两个中心均配置IBM的ESS存储服务器。
在同步方式下,PPRC将确保如果备份卷不能被更新,那么即使源卷更新成功,整个写操作也会返回失败——彻底保证源卷和目的卷的数据一致。同步方式可以保证数据完全不丢失和很好一致性保证。数据的一致性非常重要,特别是对于系统和数据库中的数据,不一致的数据无法保证数据的安全,严重时还可能造成数据库无法启动。但要注意,采用同步复制方式对系统性能有较大影响,特别是当两个数据中心服务器不够强壮时。
在异步工作方式下,PPRC能够在远端更新未完成的情况下,通过本地更新成功向主机返回“写成功”信号。其好处是: 在主备机房之间数据链路带宽成为瓶颈时,采用异步方式对数据中心主机房生产系统性能的影响不大。缺点是采取这种方式的数据将有可能丢失。所以当采用异步方式时,IBM建议先采用IBM ESS的快速拷贝功能“Copy”,备份需同步的数据,再进行数据同步。
PPRC在初始连接时需要建立逻辑卷连接,之后PPRC会自动同步该逻辑卷。利用此项功能,可以进行ESS之间的数据迁移(PPRC的同步实现机制如图3所示)。
图3(点击看大图) |
图中各步解释如下:
① 应用程序将数据写入ESS服务器磁盘;
② 生产系统中的磁盘数据传输到远程备份磁盘;
③ 备份磁盘复制生产系统数据;
④ 将写完操作信息返给生产磁盘,生产系统应用继续执行。
二、应用级灾备——HAGEO
IBM的HAGEO(High Availability Geography)的缩写,是IBM AIX平台最优秀的实时灾难备份软件。我们知道,前面介绍的PPRC方案主要是通过硬件来实现的,而此处的HAGEO方案则主要是通过软件实现的,相对来说比较经济,但对硬件的配置也比较苛刻。
这种备份方案理论上对备份中心距离没有限制,利用IP网络,不需要专用光纤;对应用程序、数据库类型和存储设备类型都是透明的,即在HAGEO下应用程序不需修改。但性能较以上介绍的PPRC方案差些,适用于中型企业选用。
HAGEO可以为客户的数据和应用提供同步实时镜像,其中增强型同步(MWC)模式可以提供数据的原始性和一致性,同时HAGEO也提供异步模式。HAGEO和应用程序紧密结合,不仅仅实现数据的实时镜像,同时也可以实现应用的自动接管,大大减少了灾难发生时手工操作。HAGEO可以做到零数据丢失,灾难恢复时间一般在半个小时左右(指应用恢复)。
目前最为主流的HAGEO异地容灾方案是基于RS/6000平台的,在这种HAGEO环境中,每个交易或任务完成之前,系统都会通过远程网络,先完成生产系统和备份系统的数据更新,保障数据实时一致性。并且像HACMP双机备份一样,提供故障检测和自动实时恢复功能。HACMP是IBM RS/6000平台上的高可用软件,它解决了本地多个服务器之间的互相备份问题。HAGEO将HACMP的功能在地理位置上作了延伸,将HACMP的优势扩展到广域网上,从而提供了一个很好的远程备份解决方案。
IBM HAGEO容灾方案的基本设想是:生产环境是两台RS/6000服务器(如图4所示),组成一个本地的双机热备环境。当本地的一台服务器发生故障时,应用会自动切换到本地另外一台服务器上。在备份地点,由一台RS/6000服务器作为备份服务器。当生产环境中的两台服务器都不能工作时,备份地点的服务器自动启动应用,恢复正常的生产环境,(如图5所示)。
图4(点击看大图) |
图5(点击看大图) |
连接两地的网络带宽应大于2MB,以确保两地备份服务器数据同步,具体所采用的网络连接方式可以多样,如专线方式的DDN、T3、宽带接入等。如果应用对I/O的写请求很多,应提高网络带宽,以保证系统的整体性能不受影响。客户端如何访问服务器也是在做方案时需要考虑的一个重要因素。注意,HAGEO方案只能负责到(服务器)系统这一层,在灾难发生后,客户端如何访问备份中心,这一点需要在网络整体设计时加以考虑。