Chinaunix首页 | 论坛 | 博客
  • 博客访问: 680026
  • 博文数量: 535
  • 博客积分: 9970
  • 博客等级: 中将
  • 技术积分: 7260
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-15 03:47
文章分类

全部博文(535)

文章存档

2011年(1)

2008年(534)

我的朋友

分类: 服务器与存储

2008-06-22 23:02:24

<项目概况>
      某基金管理有限公司信息系统灾难备份项目,系根据证监会对基金管理公司BCP计划要求,实现核心业务数据的异地备份、部分主要应用的备份,及部分办公支持系统的备份。在主机房出现灾难性事故时,备份机房能够在两个小时内就绪并支持主要业务的运行。
灾备系统项目主要包括如下几部分:
灾备机房基本网络系统
存储和同步系统
小机、PC Server及Oracle数据库
外联系统
<总体解决方案描述>
     根据用户信息系统灾备项目招标要求,我公司推荐采用美国EMC公司整体解决方案。存储系统中采用EMC公司光纤磁盘存储子系统,数据同步采用EMC RecoverPoint CDP/CRR解决方案,光纤交换机采用CISCO公司MDS9216交换机,在灾备中心配置的服务器采用IBM P5小型机及高性能PC服务器。主生产中心和异地容灾中心实现数据异地同步CRR(Continuous Remote Synchronization)。
EMC RecoverPoint CRR如下图所示,EMC的解决方案由四个RecoverPoint的机箱构成,每两台分别在主数据中心和容灾数据中心形成双服务器集群的高可用性解决方案。RecoverPoint通过光纤通道(FC)接口和千兆以太网接口,分别连接到SAN网络设备和LAN网络设备上面,从而位于主节点这边的RecoverPoint在接收到主机的写磁盘命令后,经过处理,然后通过IP方式进行,透过广域网将数据传送到异地的从节点的RecoverPoint设备处,形成历史快照,再写入到磁盘系统中,保持与主节点的数据一致性。
 

 


 
 RecoverPoint方案拓扑(图一)

<中欧基金容灾系统拓扑图>

 

 


中欧基金容灾系统拓扑图(图二)

<容灾系统方案说明>

主生产机房存储整合
     由于EMC RecoverPoint方案是一个基于SAN的解决方案,因此首先要完成主生产机房存储整合。OA系统中Windows Server 2003平台运行在本地硬盘上的Exchange 2003邮件系统、SQL版财务软件、文件服务器需要整合到SAN存储网络中。

1)      在主生产机房增加一台高性能光纤存储设备CX3-40F,容量配置成2TB。主生产机房与容灾机房实现数据异地同步CRR(Continuous Remote Synchronization)。

2)      在主生产机房增加两台光纤存储交换机(Cisco MDS 9216A),交换机配置SSM,支持SANTap协议。作为连接主机、存储设备、RecoverPoint服务器的连接设备。

3)      OA系统中每一台服务器(文件服务器、Exchange邮件服务器、金蝶财务服务器)分别增加两块 HBA卡,连接两台光纤存储交换机,构建冗余双链路访问存储设备CX3-40F。小型机利用原有的HBA卡连接两台光纤存储交换机,冗余双链路访问存储设备CX3-40Ff。

4)      小型机、OA服务器安装负载均衡软件(EMC PowerPath),避免单点故障,提高系统可靠性。

容灾机房存储整合:

1)      容灾机房增加一台高性能光纤存储设备CX3-20f,容量配置成2TB,作为灾备中心存储设备。

2)      容灾机房增加一台光纤存储交换机(Cisco MDS 9216A),交换机配置SSM,支持SANTap协议。作为连接主机、存储设备、RecoverPoint服务器的连接设备

3)      容灾机房的IBM P5服务器、HP DL380服务器各增加一块 HBA卡,连接光纤存储交换机,访问存储设备CX3-20F。
 
数据同步:
主生产机房与容灾机房间数据同步采用EMC公司RecoverPoint。EMC公司RecoverPoint解决方案支持两种工作方式,即CDP和CRR。本方案设计成金茂机房与中山北路机房实现异地数据同步CRR。
EMC RecoverPoint工作流程
RecoverPoint设备的两个FC接口连接到两台光纤存储交换机。在磁盘阵列上规划出几个功能卷: Repository卷(k-vol)、历史卷(J-vol)。Repository卷作为系统卷,存放配置信息;历史卷(J-vol)用来存放历史快照信息。EMC RecoverPoint整个数据复制过程可以分为四个阶段:分解、标记、传输、分发。如下图所示:
  
 


1)      分解:应用主机对本地存储写操作时,I/O命令一分为二,一份写到RPA,一份写到本地存储。I/O分解利用CISCO MDS9216 SAN交换机 SANTap服务,SANTap服务将I/O拷贝一份写到RPA中。
 

  
2)      标记:这个过程由RPA完成,RPA对I/O命令封装、加上标签,目的是维护数据写顺序。
3)      传输:RPA在对I/O命令加标签后,接着就进行传输过程。这个过程完全由RPA来完成,与应用服务器无关。数据经过打包、封装后,传输到异地RPA的历史卷(Journal vol),形成不同时间点的历史记录。因为所有的复制工作都是在RPA上完成的,因此这是一种带外(out band)复制方案。
4)      分发:历史卷和目标卷合并的过程。在分发阶段,不同时期的历史卷和目标卷合并,生成特定时间的复制卷。由于传输和分发分为两个独立阶段,暂停分发、分发等操作不会影响传输。在暂停分发阶段,我们可以对复制卷进行读写操作。
灾备中心数据处理
      EMC 的容灾方案是带外方式,这意味着所有的容灾数据的复制工作都是在EMC RecoverPoint的系统上完成,几乎不影响原来的应用性能包括延迟,这也是与其他产品的重要区别;其次EMC生成的大量的快照可以是秒级别的,而且每个快照文件非常之小, 这是EMC的专利技术;而别的厂家生成的快照文件很大,一般只能几个小时生成一次快照文件,并不适合长距离的容灾复制方案。
数据复制到异地后,目标复制卷与本地卷是完全一致,你可以用它做任何事情,包括常规的备份等等。另外EMC RecoverPoint提供了独特的TSP功能,即目标节点的数据处理(Target Site Process, TSP)。这个功能意味着 EMC RecoverPoint 支持对从节点(即目标节点, 容灾中心)数据的直接读取和写入操作。通过EMC RecoverPoint独特的TSP功能,管理员可以通过几步简单操作,在不中断/不影响容灾复制过程的情形下调用、查询和分析容灾中心的数据, 并实现支持恢复到任一个时间点而无需预先从主节点产生拷贝,并降低因此而节约的存储空间,并提供对现有在线业务系统进行不中断业务的容灾复制测试的灵活性,系统支持故障切换和数据回滚的能力,降低管理和操作成本。
保证数据库交易级别的一致性
EMC充分利用数据库提供相应工具或接口,进行快照并确保其数据库文件的安全及数据一致性:
1)      EMC RecoverPoint利用一致性组(Consistency Group)保持主备中心之间关联数据的时间点上的一致性。
2)      通过对快照进行“标签”的方法保证数据库快照的可用性, 非常理想地与数据库的“停顿” (quiescing)状态相吻合。作为Oracle的技术合作伙伴,EMC RecoverPoint广泛地支持Oracle等各种产品以及特性,包括深度集成了Oracle SCN功能,以绝对确保对Oracle数据库的一致性及更快速地恢复。
<容灾项目实现的效应评估分析>
  采用EMC RecoverPoint CRR异地容灾解决方案,实现数据持续保护。在容灾机房数据系统中记录秒级别的快照,管理员根据需要恢复到指定的时间点。在容灾机房的数据库可以恢复到指定的时间点,打开数据库,系统持续工作。
此解决方案解决了目前所困扰的问题。其一:当前OA系统数据存储于本地磁盘,数据库存放于磁盘阵列。数据存储分散,不易管理,数据集中存储项目实现了一个跨平台、开放的,具备高可用性、高可靠性、易扩充易管理的中心存储系统。其二:解决了数据异地容灾问题,项目上马后,即使主机房发生火灾这样的灾难事故,系统也能很快运行起来,进一步提高中欧基金管理有限公司信息系统的抵御风险能力。其三:信息系统容灾项目最大限度地保护已有的投资。
容灾项目实施后,该基金管理有限公司信息系统更为流畅、更为可靠,更好地为基金管理有限公司服务。

阅读(746) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~