Chinaunix首页 | 论坛 | 博客
  • 博客访问: 680624
  • 博文数量: 535
  • 博客积分: 9970
  • 博客等级: 中将
  • 技术积分: 7260
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-15 03:47
文章分类

全部博文(535)

文章存档

2011年(1)

2008年(534)

我的朋友

分类: 服务器与存储

2008-06-16 21:09:21

业务需求

世贸大厦的倒塌使人们清楚地看到容灾是何等重要,在至今还未清理完的废墟中深埋着800 多家公司和机构的重要数据。这其中最为世人所关注的当属金融界巨头Morgan Stanley 公司,这家执金融业之牛耳的公司在世贸大厦租有25层,惨剧发生时有2000 多名员工正在楼内办公,随着大厦的轰然倒塌,无数人认为Morgan Stanley将成为这一恐怖事件的殉葬品之一,然而正当大家为此扼腕痛惜时,该公司竟然奇迹般地宣布全球营业部第二天可以照常工作。因为先前建立的远程容灾系统保护了重要的数据。
为此,人们开始重新审视容灾系统建设的重要性。尤其是政府机关中的关键部门,他们的系统关系到整个国家的生死存亡,为这些关键的系统提供容灾支持更为重要。
但是,容灾与其他任何保险策略一样,当没有灾难出现时,我们根本无法意识到容灾系统所起到的作用,无法回收容灾系统建设所需的大量投资。但从系统安全性角度考虑,我们又必须为关键的业务支撑系统建设最有效的灾难恢复解决方案。但是在大部分情况下,当未出现灾难时,我们的容灾端系统总是处于空闲状态,花费大量投资买来的系统根本无法有效利用。这个问题一直困扰着用户。
因此,在容灾系统建设中,需要考虑的第一个问题是如何保证容灾端的系统可以得到充分利用,使容灾端系统的数据实现共享,能够利用容灾系统提供的高性能主机资源、存储资源为企业带来更大的处理能力。
很多政府部门在建设容灾系统时,提出了全新的“平战结合”思想,要求原数据中心和容灾中心无主备概念,两个站点将同时做为生产中心,在灾难发生前两个站点将根据业务特点运行不同的业务,当任何一个站点有灾难发生时,另一个站点确保能够接管发生灾难站点的全部业务同时可以根据业务特点和灾难等级依据BCP进行部分业务的接管,以保证业务的连续性为目的。
要求解决方案必须从技术上保障两个站点上数据库全部在线可用,对于相同数据集合的不同应用,如OLTP操作和分析查询操作,可以根据业务系统的特点分布到主中心和灾备中心的数据库中。容灾中心的数据实时可读取,复制过程和容灾数据读取不产生矛盾。

传统容灾解决方案缺点

传统解决方案一般分成两种:
第一种方式是基于智能存储的数据镜像技术。该技术是将数据复制通过磁盘阵列控制器在进行写入操作的同时通过高速网络向容灾系统的阵列上发送相同的I/O指令来实现,因此该方案对主机的资源占用很小;稳定性好;同步性强。该技术主要由各存储设备生产厂家所推荐,如EMCIBMHP等都提供了相应的解决方案。
第二种方式是基于主机系统的数据复制,该方式是把数据定期、在线地复制到目的地的机器上去。这种方案大部分由存储管理软件厂家提供,尤其是VERITAS推出了一系列基于该方案的存储管理软件解决方案。
 

无法实现双中心模式

目前各厂家推出的大部分容灾解决方案都属于冷容灾解决方案。其最大的缺点是系统在进行容灾复制时系统是处于关闭状态的,不能使用,容灾系统上的数据无法实现运行业务。更无从谈起双中心模式。

无论采用传统的哪种数据复制解决方案,其容灾端系统的数据库是不能处于可用状态的。当主系统出现故障需要切换到容灾系统时,必需重新启动容灾端的数据库系统。而对于数据库的启动过程需要完成如数据库一致性检查、数据库日志恢复、数据库前滚、后滚等动作。从而导致数据库系统的启动时间很长。

以上解决方案都采用物理数据复制方式,都是通过对底层的数据块进行复制的,因此当复制过程中出现故障时,将可能导致数据块的不一致性。在容灾系统中如何保证容灾系统的数据完整性、一致性将非常关键。因为只有完整的、一致的数据对于数据库系统才是有用的。当出现不一致时,容灾系统上的数据库系统是毫无意义的,此时的数据库系统可能根本无法启动、无法打开数据库、甚至是不可恢复的。
例如,在某工程中测试底层数据复制技术,进行19次模拟切换,其中有3次切换不成功,成功率仅为84%

基于智能存储复制的容灾技术要求本地系统与容灾系统的系统平台同构。因为在容灾系统中的平台包括主机系统、存储系统、应用系统和数据库系统。在这种方式中,要求本地系统和容灾系统的存储平台必须是相同。

DSG RealSync解决方案架构

DSG RealSync提供了一个源系统数据变化监测、数据自动复制、数据共享和应用切换的一体化数据复制解决方案。该技术用于为应用系统创建和维护源数据与目标数据的实时更新,实现系统容灾。
该技术与远程磁盘镜像技术的根本区别在于,RealSync是在逻辑级,通过传输和运行数据库事务(Transaction),来保持生产和备份数据库的数据一致性。一旦数据库因某种情况而不可用时,容灾数据库将正常切换或故障切换为新的生产数据库,以达到无数据损失或最小化数据损失的目的,为业务系统提供持续的数据服务能力。同时,利用容灾数据库提供查询、统计分析、数据抽取等服务。
DSG RealSync搭建“平战”结合的容灾架构:
 
从上图可以看出,通过RealSync复制系统能够维护中心1和中心2的数据库都处于OPEN状态。
两个中心的数据库都可以运行业务处理模块,中心1上新增的交易被实时复制到中心2上,中心2上新增的交易被实时复制到中心1上,实现两个中心的互为灾备。
从中心1上复制到中心2上的数据可以被被中心2上的业务模块使用,如提供查询、统计分析等功能。

拓扑结构

 
如上图所示是采用DSG RealSync构建双中心容灾系统的结构示意图。
在主生产节点,由多台服务器系统和存储系统构成统一的存储SAN结构。
在远程备份中心,可根据需要多台服务器和磁盘阵列组成容灾端的存储SAN结构。
两个中心之间通过DSG RealSync复制软件对ORACLE数据库系统提供数据实时复制功能。 通过TCP/IP网络作为复制链路。两链路之间的距离无限制。

解决方案优势

实现双数据中心,支持双向复制

利用RealSync维护的目标系统始终处于打开状态,可提供远程中心的数据共享需求,如提供数据查询、数据抽取、报表系统、试验系统功能。
同时,系统还支持双中心的双向复制,实现双中心的互为灾备架构。

系统恢复时间是指当主系统出现故障不能在短期内恢复,而需要启动容灾端系统时,容灾端系统启动的时间。
该时间不仅仅是指容灾端的硬件系统启动,更主要的、也是更耗费时间的是容灾端数据库系统的启动、业务系统的启动和外部接口的切换等。
其中又以数据库的启动最为耗费时间,因为容灾端数据库不属于正常下线,因此重起时需要作许多检查和恢复,花费的时间非常长。
RealSync维护的容灾数据库系统在数据复制过程中也始终处于打开状态,保证数据复制在逻辑上的完整性,RealSync技术为源系统提供了永远可用的后备数据库系统。在源系统出现故障时,应用系统可实现实时访问备用数据库系统。达到数据库系统的零切换目的。

可靠性是指容灾端系统是否能够保证能够启动,尤其是容灾端的数据库系统是否处于一致状态。如果不在一致状态时是否能够通过数据的恢复能自动实现一致。
RealSync维护的容灾数据库系统始终处于打开状态,保证数据复制在逻辑上的完整性和可靠性,确保容灾过程中复制数据的可靠性,并且保证容灾站点的数据库系统是可用的系统。

RealSync技术在逻辑级的数据复制技术,因此对于生产系统和容灾系统来说,其硬件平台可以属于不同的厂商、不同的型号,可采用不同的操作系统等。
通过该技术一方面为用户提供了容灾系统建设时硬件平台的可灵活选择空间。
 
阅读(489) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~