Chinaunix首页 | 论坛 | 博客
  • 博客访问: 679153
  • 博文数量: 535
  • 博客积分: 9970
  • 博客等级: 中将
  • 技术积分: 7260
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-15 03:47
文章分类

全部博文(535)

文章存档

2011年(1)

2008年(534)

我的朋友

分类: 服务器与存储

2008-06-22 17:03:30

在前一篇中我们介绍数据容灾的重要性和相关技术,从中了解到了数据容灾与我们常见的数据备份是两个不完全等同的概念。在数据容灾中最常采用,也是最有效的方案是异地容灾。这种容灾方案最有保障,因为它是把数据备份保存在另一地方,甚至另一个国家,这样数据就会更安全。试想一下在伊拉克这样连成战争不断的国家,即使把数据保存在了本国其它地方也是不安全的,所以有许多数据厂商提出了全球容灾的方案。从本篇起要向大家介绍几个典型的数据厂商的异地容灾方案,本篇所介绍的是全球最为著名的数据存储厂商——IBM的几种异地容灾方案。

    针对不同的用户需求,IBM公司的异地容灾方案产品线非常丰富,各种数据备份技术和应用方案层出不穷,处于全球领先地位。它的这些容灾方案不可能全在本文中介绍清楚,所以只选三个常见的方案类型向大家介绍。

    一、数据级灾备——PPRC

    IBM的PPRC(Peer to Peer Remote Copy,点对占点远程复制)复制技术是基于ESS企业级数据存储,通过ESCON(Enterprise Systems Connection,企业管理系统连接,是一种光纤通道)通道建立配对的逻辑卷容灾技术。这是IBM的最高级别容灾方案,主要适用于大、中型和电信企业选用。它的网络结构(如图1所示)。

图1(点击看大图)

    在图中数据中心A和数据中心B可以是两相隔上百公里的网络系统,既可以单独把某个数据中心的数据备份到另一个远程数据中心中,也可以实现相互远程备份。

    在标准的实时备份方案中,主机通过SAN与IBM企业存储服务器ESS相连接,两台ESS之间通过ESCON通道实现同步远程拷贝。受ESCON传输距离的限制,当主、备机房的距离超过2公里时,需要加光纤延伸器。光纤延伸器可以从多个不同的厂商购得,比如IBM 2029 Fibre Saver、INRANGE的9801等。在光纤延伸器的帮助下,PPRC数据备份可达到100公里以上。

    在这种容灾方案中,核心设备就是IBM的ESS的企业级存储服务器,目前最新的型号主要有IBM TotalStorage Enterprise Storage Server (ESS) Model 750/800这两种,(如图2所示)。

图2

ESS 800型企业级存储服务器支持IBM的多种、UNIX、NetWare等服务器平台之间的存储共享,通过双RISC架构SMP处理器、大容量高速缓存和串行磁盘连接提供出众的性能;使用冗余的硬件、镜像映射的写高速缓存和RAID-5及RAID-10级别的磁盘阵列技术保护支持关键业务应用程序的高可用性。对通过ESCON、FICON、光纤通道、2GB光纤通道/FICON或Ultra SCSI连接的主机支持快速率的数据传输;通过Web浏览器、CLI(命令行界面)或者通过使用ESS API来提供高效、集中的操作管理;使拥有不同种类主机的企业不仅能升至55.9TB的物理磁盘容量,同时能保持最优性能。

    对于这种方案中可能用到的SAN机在前面已有了这方面的产品介绍,在此不再赘述。不过要注意的是,在IBM的这些容灾方案中都要求全套设备最好采用IBM自己的,所以在这种容灾方案中的SAN机也需要选择IBM自己的。在IBM中提供多种不同档次的SAN交换机产品,如F08/16/32、M12等机型,可以全面满足各类企业需求。

    PPRC容灾方案能够自动将源卷上的数据同步到目标卷,实现以存储为基础的、实时的、与应用无关的数据远程镜像功能,可根据需要选择同步或异步方式。PPRC实现较为简单,纯粹基于硬件,是无数据丢失且具有完全恢复功能的灾难恢复解决方案,需要两个中心均配置IBM的ESS存储服务器。

    在同步方式下,PPRC将确保如果备份卷不能被更新,那么即使源卷更新成功,整个写操作也会返回失败——彻底保证源卷和目的卷的数据一致。同步方式可以保证数据完全不丢失和很好一致性保证。数据的一致性非常重要,特别是对于系统和数据库中的数据,不一致的数据无法保证数据的安全,严重时还可能造成数据库无法启动。但要注意,采用同步复制方式对系统性能有较大影响,特别是当两个数据中心服务器不够强壮时。

    在异步工作方式下,PPRC能够在远端更新未完成的情况下,通过本地更新成功向主机返回“写成功”信号。其好处是: 在主备机房之间数据链路带宽成为瓶颈时,采用异步方式对数据中心主机房生产系统性能的影响不大。缺点是采取这种方式的数据将有可能丢失。所以当采用异步方式时,IBM建议先采用IBM ESS的快速拷贝功能“Copy”,备份需同步的数据,再进行数据同步。

    PPRC在初始连接时需要建立逻辑卷连接,之后PPRC会自动同步该逻辑卷。利用此项功能,可以进行ESS之间的数据迁移(PPRC的同步实现机制如图3所示)。

图3(点击看大图)

    图中各步解释如下:
    ① 应用程序将数据写入ESS服务器磁盘;
    ② 生产系统中的磁盘数据传输到远程备份磁盘;
    ③ 备份磁盘复制生产系统数据;
    ④ 将写完操作信息返给生产磁盘,生产系统应用继续执行。

二、应用级灾备——HAGEO

    IBM的HAGEO(High Availability Geography)的缩写,是IBM AIX平台最优秀的实时灾难备份软件。我们知道,前面介绍的PPRC方案主要是通过硬件来实现的,而此处的HAGEO方案则主要是通过软件实现的,相对来说比较经济,但对硬件的配置也比较苛刻。

    这种备份方案理论上对备份中心距离没有限制,利用IP网络,不需要专用光纤;对应用程序、数据库类型和存储设备类型都是透明的,即在HAGEO下应用程序不需修改。但性能较以上介绍的PPRC方案差些,适用于中型企业选用。

    HAGEO可以为客户的数据和应用提供同步实时镜像,其中增强型同步(MWC)模式可以提供数据的原始性和一致性,同时HAGEO也提供异步模式。HAGEO和应用程序紧密结合,不仅仅实现数据的实时镜像,同时也可以实现应用的自动接管,大大减少了灾难发生时手工操作。HAGEO可以做到零数据丢失,灾难恢复时间一般在半个小时左右(指应用恢复)。

    目前最为主流的HAGEO异地容灾方案是基于RS/6000平台的,在这种HAGEO环境中,每个交易或任务完成之前,系统都会通过远程网络,先完成生产系统和备份系统的数据更新,保障数据实时一致性。并且像HACMP双机备份一样,提供故障检测和自动实时恢复功能。HACMP是IBM RS/6000平台上的高可用软件,它解决了本地多个服务器之间的互相备份问题。HAGEO将HACMP的功能在地理位置上作了延伸,将HACMP的优势扩展到广域网上,从而提供了一个很好的远程备份解决方案。

    IBM HAGEO容灾方案的基本设想是:生产环境是两台RS/6000服务器(如图4所示),组成一个本地的双机热备环境。当本地的一台服务器发生故障时,应用会自动切换到本地另外一台服务器上。在备份地点,由一台RS/6000服务器作为备份服务器。当生产环境中的两台服务器都不能工作时,备份地点的服务器自动启动应用,恢复正常的生产环境,(如图5所示)。 

图4(点击看大图)

图5(点击看大图)

    连接两地的网络带宽应大于2MB,以确保两地备份服务器数据同步,具体所采用的网络连接方式可以多样,如专线方式的DDN、T3、宽带接入等。如果应用对I/O的写请求很多,应提高网络带宽,以保证系统的整体性能不受影响。客户端如何访问服务器也是在做方案时需要考虑的一个重要因素。注意,HAGEO方案只能负责到(服务器)系统这一层,在灾难发生后,客户端如何访问备份中心,这一点需要在网络整体设计时加以考虑。

阅读(536) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~