Chinaunix首页 | 论坛 | 博客
  • 博客访问: 740419
  • 博文数量: 535
  • 博客积分: 9970
  • 博客等级: 中将
  • 技术积分: 7260
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-15 03:47
文章分类

全部博文(535)

文章存档

2011年(1)

2008年(534)

我的朋友

分类: 服务器与存储

2008-06-22 15:05:23

国内灾备业的发展

随着国内各行业信息系统的快速发展,特别是银行、证券、保险和政府等行业业务大集中速度的加快,企业的技术风险也相对集中。一旦发生灾难,则将导致政府和企业所有分支机构、营业网点和全

 
部的业务处理停顿,或造成企业客户数据的丢失。如何防范技术风险,确保数据安全和业务连续性,已成为企业急需面对的课题。

国家相关部门对加强信息安全保障工作十分重视,先后出台了多项有关信息安全保障措施。如中国人民银行于2002年8月下发了《关于加强银行数据集中安全工作的指导意见》,指出:"为保障银行业务的连续性,确保银行稳健运行,实施数据集中的银行必须建立相应的灾难备份中心。" "业务连续性计划应报中国人民银行备案。"。

2003年9月,中共中央办公厅、国务院办公厅转发了《国家信息化领导小组关于加强信息安全保障工作的意见》,明确提出要重点保障重要信息系统的安全,强调重要信息系统的建设要充分考虑灾难发生后的抗毁性与灾难恢复能力。

从以上资料可以看出,信息系统安全和灾难备份已经引起了国家、社会、企业的高度重视,灾难备份业务的发展是客户保持业务连续运作的需要,同时也是社会的需要和政策法规的要求,是市场发展的必然。

中国国际电子商务中心的数据容灾要求及选择

隶属于中国商务部、成立于1996年的中国国际电子商务中心(China International Electronic Commerce Center,简称CCC),肩负着国家信息化建设重点工程(金关工程)主干网的建设、维护和运营,是中国国际电子商务权威、稳定、安全的第三方服务平台。近几年,随着业务电子化平台的逐步建立和完善,CIECC服务的企业不断增加,数量近百万家,同时提供的服务种类也日益丰富。为了提升对数据的保护水平并确保业务连续性,CIECC从2005年初开始酝酿建设一套安全可靠以及高效的容灾系统:以北京亦庄的数据中心为主生产中心,在同城的东单建立同城容灾系统,并在广州建立异地容灾系统,以此构成三数据中心容灾备份系统来实现最高级别的灾难恢复能力和业务连续性。

经过对多家主流厂商容灾方案进行谨慎和严格的评估,CIECC最终于2006年底选择了由日立数据系统公司(HDS)提供的采用了Delta Resync技术的三数据中心容灾解决方案来为其核心业务应用提供最强大的数据保护。

事实上,CIECC的核心业务系统早在三年前就采用了HDS公司的产品(9980V),双方从此开始了良好的合作。从2005年初一直到2006年底的前后约一年半时间。HDS团队全程参与了为CIECC进行业务影响分析、容灾计划定制、容灾架构设计、架构设计、数据迁移、同城容灾实施、异地容灾实施、容灾演练和培训等容灾建设所必须的环节。他们从存储的角度帮助CIECC进行数据安全性方面的细致分析,比如系统中哪些业务需要保护,系统存在哪些风险等。通过密切合作,双方一起确定了本次容灾方案的架构。

真正的三地数据中心容灾模式

目前,国内95%以上的用户在建设容灾系统时选择了基于磁盘阵列的底层数据复制技术,原因在于底层的数据复制技术的先天优势:

对主机、、和应用是透明的

在数据复制过程中不消耗主机宝贵的资源

在基于磁盘阵列的数据复制技术中,又分为同步数据复制和异步数据复制两类,下面我们简单介绍一下这两类技术。

同步数据复制

同步数据复制简单的说就是生产端磁盘阵列和灾备端磁盘阵列数据基本一致(RPO≈0)。

上图是同步数据复制的过程,每一次写操作均分为4个步骤,其中第2步和第3 步是整个写操作中延迟最大的部分,它与数据传输链路的带宽和距离有紧密的联系,如果这两部分延迟过大,超过应用系统所能容忍的极限,则将导致写操作失败。

所以,同步数据复制技术主要应用于同城容灾系统,也就是生产中心与灾备中心之间的距离不超过100公里,最好在60公里以内,数据传输链路最好选择裸光纤或DWDM。异步数据复制由于同步数据复制在传输距离和传输链路上有比较严格的要求,无法满足更多用户的要求,所以在各个厂商又提出了异步数据复制的概念。

 

异步数据复制过程同样有4个步骤,但是异步数据复制中,写操作是在生产端立即完成,数据传输过程由磁盘阵列负责,与主机和应用系统无关。这就意味着生产中心与灾备中心之间的数据传输链路可以灵活选择(主要是根据RPO),距离也可以更长。

上面所展示的异步数据复制技术是第一代技术,也称之为"推数据"的方式。HDS在2004年9月就已经推出了第二代异步数据复制技术,也称之为"拉数据"的方式,关于这个技术在后面将详细介绍。

以上介绍的两种数据复制技术都是基于两个数据中心的,然而随着用户对容灾系统可靠性要求的不断提升,这两种技术都已经无法满足用户的需求。所以,存储厂商又将这两种技术整合在一起,形成了目前最为可靠、安全系数最高的容灾系统,即三数据中心容灾系统。

CIECC此次采用的就是目前业界最先进的三数据中心容灾解决方案。

三数据中心容灾其实并非一个全新的概念,自2005年起在全球范围内就已经有应用,但是根据所采用技术的不同,它又包括三种实现方式。级联方式,最基本的也是最早出现的方式。

我们以A代表生产中心,B代表同城灾备中心,C则代表远程灾备中心:该方式下,A把数据同步复制到B,B再把数据异步复制到C;如果B站点出现问题,那么A与C之间就要进行切换,因此该容灾方式不能完全保证业务的实时连续性。

Multi-target并发方式的三数据中心解决方案

 

我们同样以A代表生产中心,B代表同城灾备中心,C为远程灾备中心:A把数据同步复制到B,同时异步复制到C。这种方式是B和C之间没有联系,一旦A出现灾难,B与C之间要重新建立连接,导致B和C之间要进行数据初始化复制,需要大量的时间,而且对数据传输链路带宽的要求也非常大,而且在B与C进行数据初始化复制时,如果B再发生灾难,则C上的数据将不可用,最终导致应用系统无法进行切换,数据全部丢失。

多采用Delta Resync技术的的三数据中心解决方案

 

我们同样以A代表生产中心,B代表同城灾备中心,C为远程灾备中心:A把数据同步复制到B,同时异步复制到C,B和C之间通过异步复制的方式增加了一条备用的链路。当A出现灾难,B与C之间要启动备用链路,B只需要将差量数据复制给C即可,不需要进行数据初始化复制。这种方式能够在较短的时间内将B和C之间的数据进行同步,而且在较短的时间内又实现了B和C之间的容灾系统。

CIECC最终采用的就是后一种三数据中心Delta Resync容灾方式。HDS公司于一年前率先推出该技术,其关键点在于它实现了B与C之间的差量备份。在这种容灾方式下,任意两个站点之间都可以互为容灾备份,不会有数据丢失,因而实现了真正意义上的三数据中心容灾,也是当前最高级别的容灾方案。

CIECC决定采用HDS三数据中心Delta Resync容灾解决方案并经历了一个严谨的论证过程,是在详细分析和论证的基础上做出的慎重决定。CIECC构建了北京亦庄、东单和广州三个数据中心存储平台,其中对亦庄至东单的同城容灾系统的RPO要求近似为零,而亦庄至广州以及东单至广州的异地容灾系统RPO也要求不超过两小时。如果采用落后的容灾方案,那么当东单灾备中心(B)出现故障时就会影响亦庄生产系统(A)的正常运行,而且还需要多出一份复制卷以确保数据一致性,从而导致未来系统扩展时增加成本。通过采用三数据中心Delta Resync容灾方案,当东单灾备中心出现故障时完全不会影响到亦庄的生产系统,而且由于不需要付出多余容量来确保数据一致性,因此大大降低了用户的维护成本。

为了确保安全可靠和高效的容灾系统,同时也基于CIECC当前及未来业务发展的需要,HDS为该容灾项目中的三个数据中心各提供了一台TagmaStore Universal Storage Platform(USP)为核心存储系统,并为每台USP配置了30TB的容量。USP产品是HDS公司高端旗舰产品,其经过市场验证的卓越性能,配合以HDS独特的异步复制软件Hitachi Universal Replitor(日立通用复制软件,HUR)、系统内复制软件Hitachi ShwImage以及TrueCopy 同步复制软件等,实现了对CIECC现有异构存储环境的最先进的数据复制和灾难保护机制。

独特的 "吸拉式"异步复制技术

HUR(通用复制软件)是一种先进的复制软件,它能以异步方式复制USP或外部连接至USP的其它厂商存储系统上的数据。HUR区别其他复制技术的独特及先进之处在于,它不是将数据从生产中心推向远程备份中心,而是将其吸拉到灾备中心。下图显示了HUR软件的具有最佳性能、基于磁盘的日志功能的应用。在该图中,主数据中心的生产数据卷被复制到远程数据中心的另一个USP上。

HDS将基于HUR远程异步复制技术的容灾方式称为"吸拉式容灾"。在数据传输的过程中,数据不是由生产中心送到灾备中心,而是由灾备中心主动把数据从生产中心的设备上"拉"过来。在这种方式下,所有的性能损耗都集中在灾备中心一端,不会影响生产中心的性能。假如按传统的方式做容灾,由于数据复制的主动权掌握在生产中心的设备上,就会消耗大量生产中心存储系统的资源,从而导致生产中心性能的降低。此次CIECC容灾项目采用了基于HDS TagmaStore USP的"吸拉式容灾"技术,数据复制的主动权完全由灾备中心的USP来掌握,它通过HUR(通用复制软件)主动地把生产中心的USP上的数据"拉"过来,因此不会占用生产中心USP的资源,所以能够最大程度地保障生产中心的性能。

   

HUR是一种超越了传统复制功能的独特创新,可以说它重新界定了异步复制的执行方式。HUR在大幅降低资源消耗的同时,也为数据保护确立了新的标准。HUR不需要冗余或复制设备就可以不受距离限制地异步复制USP上的数据,帮助用户实现业务连续性的同时,大大提高其IT系统的运营效率。

中国国际电子商务中心三数据中心的重大意义

CIECC是我国第一个采用三数据中心Delta Resync容灾方案的用户,该项目仅存储方面的投资就非常巨大。之所以选择HDS作为合作伙伴,CIECC当然是因为希望通过使用技术先进、质量可靠的设备和解决方案把各种风险降至最低。"首先在产品上,我们通过与同类产品的比较和案例分析后,确认了HDS的先进性,其次是由于我们三年前就开始使用HDS的存储产品(9980)来支撑核心业务系统,至今未出现故障或数据丢失,因此我们对其产品的性能和可靠性都比较了解和放心。"中国国际电子商务中心技术总监刘军先生说,"在项目方案设计上,从一开始HDS团队就和我们自己的团队一起工作,共同研究,双方对方案中的每个细节都有充分的沟通,因此实施起来就更为顺畅。"

HDS公司不但为本次项目调动了国内的顶级技术力量,而且还协调公司全球的资源和技术团队为CIECC提供最佳支持。该项目建成后必将对CIECC自身的发展和业务转型起到十分积极的作用。CIECC在为商务部提供政务服务的基础上,一直致力于为大型企业和其他政府部门提供更多例如灾难备份服务等增值服务。数据和业务的集中是大势所趋,但并不是每个政府部门都有必要建立自己的容灾中心。CIECC的三数据中心容灾中心的建成是一种积极有效的探索, CIECC可以通过复制此模式来建立第三方的容灾中心,从而为其他有数据中心和容灾需要的政府部门及其他企业提供容灾服务。

三数据中心容灾解决方案的成功因素及借鉴意义

HDS和CIECC双方团队之间的密切合作是该容灾项目成功的一大关键。另外,由于CIECC相关技术人员的专业水平比较高,双方团队能够就项目的具体需求、方案的选择和具体实施等问题进行深入的探讨和全面沟通,这也保证了整个项目的顺利进行。

通过对此次CIECC容灾项目的分析,我们也可以从中归纳出用户采用三数据中心容灾解决方案应具备的前提条件:首先,用户采用的是大集中的业务模式,不仅业务量大,而且可能要跨地区,对数据的安全性和业务连续性都有较高要求,比如海关可能有24小时报关的需求;其次,仅靠厂商是不够的,用户自身的管理和技术人员也要具备一定专业水平,了解自己的业务需求是必要前提;当然,企业领导对项目的重视程度以及资金等问题也是重要的因素。

阅读(517) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~