【导读】神州数码提出了著名的容灾体系四阶段论:本地数据安全保护、本地应用的高可用性、异地数据安全保护、异地应用的连续性。
作为企业的血液,数据安全关系着企业的生死存亡。数据的安全性在各行各业信息化建设中已是首当其冲的大事,数据系统工程恰恰为此保驾护航,能够在其他系统要素失效时,及时恢复的正常运行,为数据安全构筑起的最后防线。
作为国内IT服务的先行者,神州数码根据客户规模、生产需求以及客户IT的现状,提出了著名的容灾体系四阶段论:本地数据安全保护、本地应用的高可用性、异地数据安全保护、异地应用的连续性。在四阶段论的基础上,神州数码容灾解决方案给客户提供了一个系统保障建设的渐进过程,用户可以根据自己的实际情况进行选择,分布建设,最终建成一个完善的容灾系统。
电信、金融这样采用大集中模式建设核心业务系统的行业,系统越集中,中的损失越巨大,构筑“准”安全防线也就最有必要。2002年,云南联通与神州数码签署了容灾工程一期协议,由于实施效果良好,2004年云南联通又开始和神州数码签署了二期协议。
一、项目概况
作为中国联通省级单位,本次的容灾工程涉及到云南联通的综合营帐系统、短消息计费等系统,它们分别运行在不同的操作系统平台上,其数据也分布在不同的上。业务系统已投入生产使用,所以,在整个工程实施过程中减小对运行业务的影响是重中之重。
在容灾系统一期工程中,神州数码帮助云南联通完成了数据迁移,将原来分布在多个存储设备上的综合营业系统、综合帐务系统、短信计费系统、缴费卡系统的数据迁移到新购买的存储设备上,并且将各业务系统数据实时复制到容灾中心存储设备上,实现云南联通生产系统的数据容灾。在一期工程中,容灾中心没有配备主机,如果生产中心发生严重灾难时,容灾中心不能接管业务。因此,神州数码又帮助云南联通开展了二期工程,逐步从数据级容灾过渡到应用级容灾。
除此之外,还建立了良好的运行管理制度,建立完善的容灾切换与恢复流程,保证在发生严重灾难时各业务系统得到及时有效的恢复。
二、用户需求分析
相比起其他工程来说,云南联通容灾一期工程不是简单的存储扩容和升级,而是包含了几个子系统的移植和割接,实施难度大、复杂程度高。工作量相当惊人,首先因为是省级数据大集中的模式,所涉及的数据量大;其次所涉及的硬件设备纷繁多样;其三操作系统各不相同;其四数据库版本高低不一;其五应用系统五花八门。在如此复杂的环境中要求数据移植必须分毫不差,而且每个系统的割接都必须在当天晚上完成,绝对不能影响联通第二天的正常营业。
而二期工程则逐步过渡到应用级容灾;在灾难发生时,保障系统及数据的安全。主要考虑使营业、帐务系统在生产中心发生灾难时能够尽快地切换到容灾中心,使这两个系统的应用能够尽快恢复,从而使云南联通充分保障客户正常使用业务的权利和维护良好的企业形象。
三、如何满足需求
1、数据级容灾
按照规划,神州数码在首期工程中建设同城灾备中心,主要工作是硬件平台搭建、数据迁移、测试演习等工作。其中最重要也是难度最大的就是数据迁移,将原来分布在多个存储设备上的数据迁移到新购买的存储设备上来。包括综合营业系统、综合帐务系统、短信计费系统、缴费卡系统的数据迁移工作。
这个阶段在整个项目实施过程中具有里程碑的意义,并且由于这几个系统都是实时生产系统,保证数据在迁移过程中的完整性、一致性和保证业务系统在停机迁移后仍能正常工作是本次迁移的重点,也带来了极大的风险和难度。
为保障应用系统迁移的成功,神州数码公司在着手实施前做了大量的调研、实验工作以确认实施方案的可行性,制定了迁移的规划和具体操作步骤。在规划中包含了详细的时间安排、操作步骤、风险分析与应急方案。在与用户进行详细的讨论后,按不同系统,分4次进行了移植,保证了在计划内的按时营业。
在完成数据迁移后,神州数码又帮助用户建立了同城灾备中心,采用基于智能存储系统的同步数据复制技术,对综合营帐、综合结算、综合客服系统的重要数据进行同步复制,实现了数据级的容灾备份,使云南联通用户的数据安全性有了强大的保障。
2、应用级容灾
但仅有数据备份是完全不够的,要满足所有支撑系统的需求,所以,在二期建设中,我们的目标就是逐步过渡到应用级容灾。此外,灾难管理维护机构设置和人员组织、管理维护制度和操作规程的制定等也必须形成一个完整的体系。
在应用级容灾上,工作的重点有两个:一、在发生灾难的时候,业务如何进行接管;二、如何将数据实时同步到容灾中心以及如何为报表系统使用?
为了解决业务接管问题,保证业务的连续性,必须在备份中心放置业务主机,同时还需要建立良好的运行管理制度,建立完善的容灾切换与恢复流程,这样才能保证在发生各种灾难时各业务系统得到及时有效的恢复。
客户的对容灾中心的建设投资很大,但是平时基本处于空闲状态,为了最大限度地保护用户的投资,我们充分挖掘备份中心的功能,使其在平时能够得到充分的利用。
如在数据的充分使用方面,我们在云南联通的业务支撑系统的运营中发现在月末的集中时段出报表时,对系统(包括主机和磁盘阵列)处理的压力非常大。因此,在二期建设时,我们通过数据拷贝功能,在容灾中心建立帐务系统报表处理系统,充分了利用容灾系统数据,同时缓解了主用系统处理压力。
又如在容灾中心建立测试、开发系统,这样既改善了原来的测试环境,同时也充分发挥了备份中心主机和存储的作用。
3、丰富的层次结构
一期建设完毕后,云南联通已采用HP 软件实现了数据从生产中心到容灾中心的复制,根据二期的要求,云南联通选择采用HP即使用HP的Business Copy软件,在容灾中心,定期将营帐的数据复制出来,由查询系统使用。示意图如下:
4、成功的关键
容灾是一个复杂的系统工程,而不仅仅是容灾产品和技术的简单安装。因此,除却技术因素外,项目的执行力、管理能力成为成功实施的关键。
为了帮助客户建立一个安全、有效的容灾系统,神州数码推出了容灾工程服务体系,从系统咨询规划、系统建设直至系统运行维护的一个完整的服务体系。
据了解,根据云南联通的容灾工程的要求,神州数码提供的服务包含下列内容:
1、分析、评估云南联通的主机、存储、软件、应用及网络环境,量身定制,设计最优化的满足云南联通实际需求的高可用性的容灾实施计划;最终要达到和接近应用级容灾的条件;
2、根据设计进行系统升级、系统建设、系统切换等;
3、进行系统综合测试和定期灾难预演;
4、系统配置和灾难流程归档及容灾方案知识移交(包括维护指导),保证云南联通的管理人员能在方案实施结束后顺利管理容灾系统。
四、项目评价
容灾一期建设经历了过系统安装、调试达到技术规范书规定的指标后,云南联通即与神州数码一起按照验收标准对整个系统进行验收,保证系统平台的安装实施达到设计目标。
云南联通容灾工程的顺利实施,使其容灾备份系统逐步过渡到应用级容灾;在灾难发生时,保障系统及数据的安全,营业、帐务系统在生产中心发生灾难时能够尽快地切换到容灾中心,充分保障客户正常使用业务的权利和维护良好的企业形象。