Chinaunix首页 | 论坛 | 博客
  • 博客访问: 411499
  • 博文数量: 157
  • 博客积分: 5010
  • 博客等级: 大校
  • 技术积分: 1975
  • 用 户 组: 普通用户
  • 注册时间: 2009-02-17 15:22
文章分类
文章存档

2013年(19)

2011年(1)

2009年(137)

我的朋友

分类: 服务器与存储

2009-04-05 21:47:42

备份系统建立的背景
从某种意义上说,我国商业银行迈向市场经济的过程,就是一个不断为了加强竞争力、扩大业务、改善金融服务手段而纷纷引入先进的计算机系统支撑业务运行的过程。
建设银行从20世纪90年代初开始,用不到5年的时间,基本完成了从单机操作向开发应用的全行性网络包括电子资金清算系统、龙卡网络网络化交易的过渡。其建设银行系统、会计总账传输系统和电子邮箱系统,还实现了与SWIFT系统的联网。除全行性网络外,还以大中城市为中心建立了众多区域性交易网络,至1997年已在210个城市行完成了"城市综合网络系统"的建设,并实现了全行网络系统的连接。
在计算机技术广泛应用的支持下,总行于1996年建成的资金清算系统,可以为客户提供快捷、安全、高效的电子汇划服务,实现了系统内异地资金清算24小时内到账。在此基础上,还为许多企业建立了全国销售资金结算网,并为诸多证券商提供交易资金清算支持,实现利润73亿元,创历史最好水平。1999年7月,建设银行在《银行家》杂志全球1000家大银行排名中位居第65位。
与国内外许多著名大银行一样,建设银行目前主要业务的开展均高度依赖于计算机系统的正常运行,一旦计算机系统发生故障,将直接影响银行的正常营业,给银行和客户带来不同程度的损失,甚至产生严重的社会后果。总行的运行中心机房是建设银行系统的数据处理中心和网管中心,也是全行资金清算、信用卡异地授权等关键业务系统的中心枢纽。这里的计算机系统如果崩溃,将给整个建设银行的信誉和经济利益带来难以估量的损失。为保证总行计算机系统安全、可靠地运行,总行已采取了双机热备份等容错措施,以预防因局部设备故障而导致整个系统的瘫痪。但对于那些造成整个计算机系统及网络设备毁坏、大范围内的灾难性事故,如火灾等,容错措施显然无济于事。如何保证在灾难发生后,仍能完成其业务中心枢纽的作用?总行为此建立了资金清算灾难备份系统。
技术方案的确立
据介绍,建设银行总行于1997年3月成立了计算机灾难备份模式安全设计小组,通过风险分析提出了如何划分应用系统灾难备份等级以及如何选择最佳灾难备份方案的策略,明确提出了不同类别的行、不同等级的应用系统的数据备份策略、系统备份策略和网络备份策略,做出了同城专用灾难备份中心、共用灾难备份中心、相同机型互为备份和网控中心四种灾难备份模式的设计,对全行如何开展灾难备份工作进行了规划,并提出了现阶段灾难备份工作的重点主要放在进行灾难预防上面的指导原则。设计组的研究成果(中国建设银行计算机系统灾难备份模式设计及规划建议)下发全行后,对指导全行灾难备份工作的有序开展,避免大的投资浪费和低水平重复性建设起到了重要的指导作用。
总行科技部运行管理处朱玉红处长说,在规划的指导下,总行主要对资金清算系统的总体结构、业务流程、网络结构以及目前的系统处理能力、风险防范措施等进行了分析,对资金清算灾难恢复系统建立的必要性进行了阐述,并对资金清算系统,灾难恢复系统的安全性、业务数据完整性和一致性、系统切换时间、恢复系统业务处理能力、备份技术等各方面提出了具体的需求。
产品选型是在广泛调研和大量测试的基础上,首先考虑所用产品能否满足设计目标;其次要保证所用技术或产品的先进性,使本系统能满足未来一段时间内全行业务发展的需要。当然,产品的性能价格比和技术支持水平也受到非常重视。
采用的核心技术
在生产中心与备份中心之间辅设远程光纤,实现百兆带宽直联,两端接驳智能存储系统,在操作系统之下以全同步方式实现数据的实时同步,是建设银行的这套备份系统所采用的核心技术。该系统心 9000/T600为生产系统主机,以HP 9000/T500为灾难备份系统主机,以EMC智能信息存储系统的SRDF远程磁盘镜像技术为数据备份技术,在生产中心和灾难备份技术,在生产中心和灾难备份中心之间(距离20公里)通过直连光纤实现数据备份通道,构成总行资金清算灾难备份系统。总行资金清算灾难备份系统由网络备份、远程数据备份、系统备份、应用数据检查与恢复四部分组成。
网络设计是在总行两座大楼内各申请一条带宽为256K的X.25线路,分别经过两座大楼的DDN节点机,通过不同的路由连到X.25分组机房,利用电信局提供的连选功能使两条X.25线路共享一个X.25地址,实现了两地X.25网络以同一地址与分行互连,既起到总行清算网络实时备份的作用,又扩展了网络带宽,同时还避免了灾难发生时与分行的关联操作。
远程数据备份则通过以下方式实现:两地系统EMC磁盘阵列的远程链接控制器RLD(Remote Link Director)提供ESCON标准端口,ESCON端口通过多模通信光缆连至光纤扩展器Repeater上,再通过单模通信光缆,建立起数据备份通道。
由于EMC磁盘采用了磁盘镜像复制技术和ESCON专有通信协议,所以,可以保证备份数据通信的安全性。为保证数据备份通道的可靠性,每台EMC磁盘RLD端口采用双份冗余,并用两根多模光缆连至Repeater(单、多模光纤转换器)上,这样RLD端口、连至Repenter上的多模光纤、Repeater中的转换卡及连至远方的单模光缆均为双备份冗余。在系统正常运行中,将生产系统的磁盘阵列设置成源磁盘,将灾难恢复系统的磁盘阵列设置成目标磁盘,这样源磁盘中的数据就会在EMC SRDF软件的管理下通过数据备份通道镜像至目标磁盘之上。为了在灾难发生时,尽可能减少数据丢失,磁盘镜像的工作方式设置为同步方式,保证两地磁盘写入数据的一致性。
系统备份由两地的HP9000系列主机实现。在生产系统中,由两台HP9000/T600型计算机共享一个EMC Symmetrix 3000磁盘阵列。为保证生产系统的高可靠性,磁盘阵列中的磁盘在本地组合成磁盘镜像,两台T600计算机通过HP的MC/ServiceGuard软件构成群集系统。异地备份系统启用原总行清算系统两台运行主机设备HP T500,结构与生产中心相同。为了进一步增加系统的可可靠性,异地备份系统中还采用了EMC TimeFinder快速可分离逻辑卷技术,在备份系统另外建立一个数据库的定时备份,解决在极端情况下备份系统数据库不能启动的问题。此外,方案中还将采用Informix提供的onbar/ism数据备份工具在生产中心和备份中心保留Informix数据库的零级备份和逻辑日志备份,作为上述数据备份/恢复方案的补充。
应用数据检查与恢复是对于系统层和数据库不能保护的数据,在应用系统层采取一系列的手段(如故障恢复、日间勾对、日终勾等)进行数据恢复,最终保证应用系统恢复运行。
目前的运行状况
灾难备份作为计算机系统应急措施的最高形式,是计算机系统安全运行的最后保护屏障。但灾难备份系统的建立不只是在技术上存在复杂性,在实施和管理方面难度也很大,且投资巨大。总行遵循"广泛调研、大量测试、适度开发、精心集成"的技术路线,完成了项目的实施。项目投产后,制订了严格管理程序和完备的运行档案,并进行定期演练。
据了解,中国建设银行总行资金清算灾难备份系统自1999年7月11日正式投产至今,运行稳定。并且其间经历过三次全国的2000年测试和"灾难备份系统灾难模拟切换演习",业务均正常进行。
朱玉红处长表示,他们将进一步跟踪相关领域的前沿技术,并加以消化吸收,以确保系统的先进性,充分利用现有软硬件资源,发挥更大的作用。
阅读(1269) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~