Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1265189
  • 博文数量: 1211
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 14340
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-09 11:20
文章分类

全部博文(1211)

文章存档

2011年(1)

2008年(1210)

我的朋友

分类: 服务器与存储

2008-06-09 19:11:36

背景简介

  随着互联网技术的突飞猛进和全球一体化经济的高速发展,现代商业的发展正愈来愈趋向自动化和复杂化。如今,越来越多的企业24x7运营——特别是以国际业务为主的大型企业——它们需要不断提高竞争优势,以保持自身的盈利能力和生命力。这使企业对信息系统及其数据的依赖程度比以往任何时候都更深,信息系统及其数据已经成为决定企业存亡的关键因素之一。在复杂而富有挑战性的全球商业环境中,企业要经受得住任何形式的系统宕机的考验。因此,实现不间断数据可用性的业务连续性方案,及经过考验的灾难恢复方案无疑至关重要。这也是为什么在世界范围内越来越多企业和机构不惜重金实施和构建了各种各样的保护措施和系统,用以避免一些百年不遇但十分致命的灾难对企业信息系统及其数据的破坏性影响。

  中国进出口银行作为国家重要的政策性贷款管理和执行机构,每天要处理大量的大型信贷业务,它的生产数据对于整个银行机构的重要性也非比一般。进出口银行原先对系统的数据保护仅限于采用传统的备份软件和磁带媒体的方式。这种保护方式基本上可以保证每天的数据恢复能力,但是这种方式会受到诸多环节的影响,例如数据备份失败、磁带媒体失效、系统恢复失败和数据丢失多等问题,可能造成不可挽回的严重后果。

  鉴于传统备份软件和磁带备份的方式已经不能很好的满足中国进出口银行的要求。为了改善对生产数据的保护水平,进出口银行于2004年开始酝酿,并于2005年底开始,选择了国际领先的基于存储阵列的远程数据复制技术来为其核心应用提供更加强大的数据保护。HDS专业服务团队作为设备和专业服务厂商、现代设备公司作为系统集成商,在2005年12月同中国进出口银行共同签订服务协议,帮助进出口银行针对其核心业务生产系统的数据,基于存储的远程数据复制机制,提供系统分析、设计和实施服务。

  项目要求

  中国进出口银行通过同HDS公司长期的咨询和调研,基本确定的数据保护的要求为数据级的灾难备份系统,即达到了2005年4月国务院颁布的《重要信息系统灾难恢复指南》中的第三级灾备定义的水平。实际上,本次项目除了备用数据处理和网络处理系统部分要求外,其它的技术要求部分已经达到了第四级灾备定义的水平;在保证远程灾备数据的完整性技术要求前提下,实现系统恢复时间(RTO)不超过72小时(在灾备系统远程站点服务器、操作系统、应用和网络就绪后),系统数据丢失时间(RPO)不超过8小时的灾备建设目标。考虑到未来的可扩展性,系统还能够在将来进出口银行拥有足够的条件时,轻松地升级其系统容量和提升灾难保护定义级别的能力。

  方案概述

  中国进出口银行北京数据中心的生产存储阵列为HDS 公司的lighting 9970V,托管在上海浦东的数据中心的远程备份存储为HDS 公司的TagmaStore NSC55磁盘阵列。两站点之间通过不同电信公司提供两条通讯线路来提供数据通讯。生产系统的服务器的更新写IO通过HDS的TrueCopy远程数据复制软件的机制被接近实时传送到远程的NSC55磁盘阵列的备份卷上。一旦灾难发生,在任何情况下,进出口银行可以在远程备份中心得到一份符合设计需求的可用数据副本。

  方案优势

  这种架构设计的优势在于利用了HDS的远程数据复制软件TrueCopy异步机制其具有实时传送更新写IO和可以进行灵活定义逻辑一致性组的能力。使得系统的设计:

  当灾难发生时,可以将系统的数据损失降低。还可以保证系统以应用的逻辑在存储阵列一级处理更新数据,而不是磁盘的位图;

  一旦灾难发生的时候,可以抵御雪崩式灾难(Rolling Disaster)所导致的远程备份系统数据完整性失败;

  配合同HDS的阵列时间点拷贝软件ShadowImage的组合设计,系统还可以抵御在数据再同步情况下发生雪崩式灾难时造成的远程备份系统数据完整性失败;

  结合中国进出口银行的核心应用的特点、链路容量的实际情况,以及实际的数据保护要求,提高了用户投资回报和系统可操作性;

  数据复制所进行的所有操作完全由存储阵列进行控制,不消耗生产服务器的资源;

  本地生产存储阵列对性能和容量有很高的要求,如果在远程备份端使用同级别的产品进行配对会造成用户的投资浪费。NSC55以企业级的功能和经济划算的价格,既充分满足了同高端磁盘阵列进行灾难备份的要求,又能很好的使客户得到投资保护;

  将来的生产中心如果升级为HDS的TagmaStore USP阵列之后,现有系统灾备架构还可以平滑升级成为业界最为先进的HDS Universal Replicator远程数据复制系统,从而进一步提升对数据的保护能力。

  HDS服务

  HDS在本次项目实施过程中为进出口银行提供了以下服务:

  项目管理服务:为整个项目提供了任务、资源和进度的详细定义和规划。定期进行项目会议和任务跟踪等,强有力的保证了项目按时按需顺利平滑的完成和整体目标的实现。

  链路负载分析服务:按照客户的核心应用的实际情况,提供了负载分析和链路需求评估。为项目的技术架构设计和实施提供了有利的基础依据。

  灾备系统实施和调试服务:从设备的安装、系统的配置和文档,提供了可以称之为交钥匙工程的专业服务,使得系统在用户工作量最少的情况下的成功运转。

  系统测试服务:模拟了灾难发生时的数据可用性,模拟了灾难演练的情况下的测试流程等测试任务。

  实施挑战

  由于进出口银行的现有条件限制,放置备份数据的远程数据机房、设备、通讯线路和系统运维流程都不具备,再加上进出口银行远程数据复制项目是国内银行中较早实施的开放系统超过1400公里的远程灾备项目,本次项目的实施和实现难度对于进出口银行、HDS和现代设备来说都是挑战。,三方最终能够克服重重困难,确保本次项目顺利实现,主要得益于以下几个原因:

  首先,项目采纳并执行了良好的项目管理方法论。良好的项目管理方法论保证了所有任务和负责方能够清晰目标、精确任务理解、良好的协调配合和缜密的计划。尽管各项任务艰巨,但是项目组都能从容处理;

  其次,每个成员都具备专业精神。从技术实施顾问到项目经理,无一不是经验丰富,认真负责。全体成员通过经验、预防性的计划和考虑,将许多问题一一化解,排除于未然;

  最后,成员之间的团队合作、相互的理解和充分的沟通使得整个团队能够力克难关,确保项目组的所有任务都能够按计划顺利执行。

  例如:就此次灾备项目的数据链路条件来说,由于其存在的长期性,成本问题是十分突出的,而对于系统性能来说又是必不可少的。这一矛盾使得进出口银行和实施项目组曾一度陷于困惑。

  首先,在我们为进出口银行提供链路容量分析的时候发现其每年年底的磁盘写IO量十分惊人。但是,其他所有时候都不如这个特殊时期的写IO负载来得大且持续时间长。我们针对这一问题提出不要为了特殊的每年一次的数据IO峰值情况,而全年使用昂贵的带宽。最终,我们是按照平时的写IO峰值提出的链路容量建议。

  另外,经过一段时间的观察以及和客户的共同研究,我们发现有些数据卷是应用用于在批量之前和之后进行的临时备份。于是,在链路容量分析阶段,项目组再次确定了一些可以排除在远程数据保护之外的卷。经过处理之后,使得系统写IO负载得到了有效地改善。

  又例如:由于阵列之间的数据的初始化复制需要很大的带宽消耗,使用日常的数据复制链路进行初始化耗时又会很长。针对这一困难,我们提出本地进行初始化复制,然后再将备份阵列运送至上海进行二次安装和数据再同步的实施方案,并取得了成功。在设备运输期间,北京生产数据中心的应用和生产阵列不受任何影响,HDS的存储阵列的设计会将所有传输中断期间的数据差异存在于存储设备中,不会因为掉电时间过长而影响数据再同步。

  项目现状

  项目实施团队各方通过共同分析、协调和努力,在现有条件和满足用户需求的前提下,历时两个月时间,完成了相应的设计和实施,并最终实现了系统的成功实施和运行。目前,项目进入收尾阶段,系统的数据复制功能正常。借助HDS产品带来的先进性和革新性优势,中国进出口银行的数据系统获得了强大的灾备能力,银行的核心应用数据的安全有了保障,风险防范能力获得了提高,服务质量也得到了改善,中国进出口银行的综合竞争力也得到了提高。

阅读(1107) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~