Chinaunix首页 | 论坛 | 博客
  • 博客访问: 677053
  • 博文数量: 535
  • 博客积分: 9970
  • 博客等级: 中将
  • 技术积分: 7260
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-15 03:47
文章分类

全部博文(535)

文章存档

2011年(1)

2008年(534)

我的朋友

分类: 服务器与存储

2008-06-23 00:51:04

今天,信息技术已经渗透到我们生活的方方面面,它在改变我们的生活方式。离开信息技术人类生活将陷入困境,因此人类必须考虑的问题是我们赖以生存的信息技术是否安全可靠。无数的经验告诉我们信息技术本身在发展,信息系统它不能给我们带来绝对的安全可靠,人们必须考虑各种容灾解决方案。
影响信息系统崩溃的灾难形式可能很多,包括自然原因导致的灾难如地震、洪水、火灾、飓风、恐怖活动等和人为操作导致的系统崩溃或数据无法恢复。而进入90年代以来,一个现代企业或机构如果没有高可用性的计算机系统,几乎无法参与日趋激烈的商业竞争。系统保护措施必须能够确保在各种自然的或人为的灾难发生造成基本处理设施毁坏的情况下能迅速恢复系统的处理功能。因此保持业务的持续性已成为不同机构、机关以及企业建设自己信息系统必须考虑的重要目标之一。
就信息系统而言,信息是信息系统的基础,容灾的本质是对数据(数字化的信息)的备份,广义的容灾解决方案是在生产中心现场整体发生瘫痪故障,至少要保证数据的完整性和一致性,实现数据的可恢复性,这便是数据级容灾。根据数据备份的介质的不同数据级容灾可以分为离线备份(磁带)和在线备份(磁盘)。磁带备份只能做到数据级容灾,理论上它可以在灾难发生时保证系统可以恢复到上次系统备份的数据,丢失部分数据在所难免(上次备份后的变化数据)。采用离线磁带备份,备份后的磁带一般要运到数据中心以外的其它地方存放,人们在实践中发现这种磁带备份的方式经常到了关键时刻需要恢复时由于种种原因而失败,比如磁带介质的保存条件不妥就会造成介质失效。同时即使从磁带可以顺利恢复数据,但其恢复时间也往往较长。
近年来随着磁盘技术的进步,磁盘性能不断提高,价格不断下降,采用在线的磁盘阵列做备份成为数据容灾的首选,磁盘备份比磁带备份具有可以更好保证数据的完整性和一致性,实现数据的可恢复性。此外以磁盘阵列做数据容灾设备可以进一步做到系统级容灾,即保证业务连续运行的容灾信息系统,这便是狭义容灾系统,即目前业界认同的系统容灾解决方案。
狭义容灾系统是在生产中心现场整体发生瘫痪故障,备份中心不但保证数据的完整性和一致性,还要以适当方式接管生产中心工作,从而保证业务连续性的一种解决方案。这也可以称为系统级容灾系统。系统级容灾要求数据在本地和远程之间做到实时镜像,做到完全同步,而一旦灾难发生,整个系统还要完成网络,主机及应用系统等在远程中心对生产中心的接管,因而这是一个比较复杂的切换过程。但无论如何在远程中心拥有一份完整的生产中心的镜像数据是系统级容灾的基础。
理论上讲,在远程中心的一个完整的数据镜像(部分数据丢失)可以通过主机软件方式实现,但在实践中人们逐渐认识到基于主机的远程数据镜像在实时性,完整性和一致性条件下变得几乎不可实施,因而几乎没有真正成功的基于主机软件的系统级容灾案例。
目前成功实施远程数据镜像的技术是基于存储磁盘阵列的底层数据镜像,这种技术由于在磁盘阵列之间镜像要求磁盘阵列一定是智能化的,即在本地和远程的两个磁盘阵列之间实现数据的实时性,完整性和一致性的镜像,它做到了和主机,网络,应用的透明,是目前全球在信息安全容灾备份领域中实现级别最高的方案,全球成功实施的系统级别容灾解决方案基本都是基于此技术,EMC已经成功实施15000多例这样的系统级容灾系统,占已实施的容灾系统的绝大多数。
    数据备份剖析
信息系统的群集方案设计思想是消除信息系统的单一故障点,它在用户数据中心的场地安全的前提下能够应付所有可能引起计算机系统失效的问题。这些方案和措施应该确保:
无论是由于硬件,软件或电源的失效都不应中断数据中心的处理工作;
在由于故障影响到基本系统的运行时,应在备份系统迅速恢复处理功能;
在备份系统投入运行之后,应能迅速恢复基本系统的处理功能
在多数数据中心处理设施中,关键数据、系统库和数据库的备份操作已经成为日常运行处理的一个组成部分,以确保出现问题时能“迅速”恢复。典型的问题包括应用程序出错(此时需要返回到前一个数据库版本状态),或是运行故障(例如,磁盘驱动器失效等)。通常备份数据磁带是离线保存在安全场所的。对于普通的文件错误,如果备份磁带就在现场,则数据恢复处理只需要几分钟时间,但是如果是整个数据库环境遭到破坏,则恢复需要花费几天的时间。
利用磁带拷贝进行数据备份和恢复是最常见的传统灾难备份方式。这些磁带拷贝通常都是按天,按周或按月进行组合保存的。
使用这种方式的数据拷贝通常是存储在盘式磁带或盒式磁带上,并存放在远离基本处理系统的某个安全地点。磁带通常是在夜间存储数据,然后被送到储藏之处。磁带拷贝经历的整个过程大致是这样的:
业务系统在半夜停止工作;
开始提取数据库拷贝(46小时)
将磁带码放好,准备运到安全的存储地点;
早上1000运输部门来运输;
运送到储藏地点;
中午时磁带被安全储存
所以,存储到安全地点的磁带拷贝,其上的数据已有数小时(在上面的例子中为12小时)的延迟,而这就是灾难情况下进行恢复时,所能找到的最好的当前数据!
而在灾难或各种故障出现系统需要立即恢复,必须将磁带提取出来,并运送到恢复地点,然后进行如下处理,通常还要滞延几个小时:
从磁带的存放地点选取适当的恢复用磁带(24小时);
将磁带运送到恢复现场(24)
数据恢复到磁盘上(818小时)
追溯数据库数据,寻找最佳的恢复水平(612小时)
恢复应用程序的处理工作
整个上述过程中至少需要花费18个小时,才能使环境恢复到灾难发生前12个小时的状态!而这中间可能出现的信息或数据丢失,以及后续业务风险等因素还没有被恢复人员考虑进去。
从使用磁带拷贝方式进行的系统备份和恢复的过程可以看出,基于磁带拷贝方式的传统灾难备份方式有着明显的缺陷,越来越不适合用户不断发展的业务系统的需要。
基于磁带拷贝的灾难备份方式不管是备份过程还是恢复过程非常复杂。复杂的恢复过程将回极大地影响着系统恢复的效率。
磁带通常是在夜间备份的,并于第二日被送到储藏之处。该过程本身给备份数据带的使用带来相当大的延迟。
在进行恢复操作时,必须使用正确的磁带。而存档磁带的数量可能有成百上千盒,要在成堆的磁带中找到正确时间的磁带给管理上带来很大的挑战。
在恢复数据库的时候,要求事件处理的顺序必须正确,这样才能恢复到数据库的当前状况。当恢复过程需要涉及到若干个磁带时,出现磁带找不到、不可读或顺序错误的可能性是很大的。
   
     采用磁带备份存在以上诸多问题,磁带备份是在网络技术发展成熟之前的必然选择。磁带备份的数据应该放在数据中心以外的地方,在数据中心发生灾难时再从存放磁带的地方取回备份磁带完成数据恢复的任务。人们对磁带备份的最大担心源于磁带介质的可靠性,其次在于磁带备份处理程序的复杂性。
     今天,随着网络技术的发展成熟,网络是信息系统高速公路,人们很自然想到如何使用网络实现信息的传输和备份,用户完全可以将需要备份的数据通过网络存储在远程。这种网络远程冷备份的方式首先采用磁盘介质,备份可靠性大大提高,同时通过网络高速公路的数据传输代替了人工的磁带运输,保证了数据备份的实时性和数据快速在线恢复。
网络远程冷备份方式可以采用传统的磁带备份相同的模式,这时远程的磁盘可以安装在本地主机上,它拥有设备名称,可以模拟磁带介质使用。每个用户感觉象增加了一个很大的存储磁盘空间,但实际上这个存储设备物理上可能在几百公里以外的地方,因而如果用户把数据备份到它上面就相当于在远程存放了一个在线的备份。一旦生产中心出现灾难(比如火灾),在网络上我们仍然存放一份数据的备份。我们可以用它恢复系统。
但是这种方式不能保证实时性,适合需要备份量较小的系统,对于需要存储大量数据的关键业务系统不具有可实施性。同时,这种方式一定有部分数据丢失,是在有一定数据丢失前提下的数据级的容灾。再者,用户一旦真的这样实施了所谓的容灾,其对网络的带宽的影响很大,有时会严重影响业务系统。
总之,这是一种理论设想,很少可以真的实施,尤其是关键业务系统。
    备份
    基于主机的灾难备份方式主要有两种:
一种利用主机建立数据拷贝的方法是让主机同时将数据分别写到本地和远程磁盘上。这种方法有几个问题需要解决,包括资源的消耗问题,数据的备份周期问题,对日常运行的影响问题,以及如果将拷贝操作插入应用程序中,所带来的应用维护的问题等等。
另一种利用主机建立数据拷贝的技术是在发生事务处理的同时,实现主机到主机的事务处理传送。第二种方法为用户提供了这样一种选择,就是只将事务处理过程存储在远程磁盘上,以便稍后或直接利用所记录的事务处理过程对备份数据库环境拷贝进行同样的处理,处理速度也可以相对较快些。
基于主机的灾难备份方式也有着明显的缺陷:
两种方式都需要占用大量的主机资源,其成本开销都很大,会影响业务系统的性能。
利用主机建立数据拷贝的方法必须考虑如何将拷贝操作插入应用程序中,这给系统的日常管理以及应用系统的维护提出了很大的挑战。每种环境都各有不同,比如版本级别、速度、技术、操作系统级别。除了占用主机资源以外,还将占用大量的网络资源,也会给业务系统的性能造成明显的影响。由于远程传输有距离,服务器必须有有效的机制控制两边的操作是否成功,否则会出现两边数据的不一致。
扩展能力不佳,每套服务器系统需要建立自己的灾难备份系统。
系统平台较多时,很难协调/管理全异的相互关联平台。
出现灾难后,对数据进行恢复的难度大,对应用系统的影响很大。
这种方式是和主机相关的模式,具有理论价值,但在实施过程中人们逐渐认识到它的问题和缺欠。我们很难在实践中找到这样的成功案例,尤其是关键业务系统没有采用这种方式容灾的。
    备份剖析
进入90年代以后,磁盘阵列技术发展十分迅速。就象七、八十年代通过IBM3705等设备的电信处理控制功能来减轻处理负荷那样,磁盘阵列正在将磁盘镜象功能的处理负荷从主机转移到智能磁盘控制器企业智能存储系统上。有了这种技术,就可以实现生产中心和灾难备份中心的操作系统、数据库、系统库和目录的实时拷贝维护能力。如果在系统恢复场所具备了实时数据,那么就可能做到在灾难发生的同时实现应用处理过程的恢复。远程备份系统的重新启动可以做到象一般电源故障后的重新启动那样简单!基于智能存储系统的远程容灾及异地备份解决方案就是通过上述方式实现的,目前已占据了主要市场份额的远程容灾解决方案。它可以实现不同地点之间的磁盘数据实时备份,距离可以是几英尺、数英里、甚至跨越不同的大陆。目前还没有其他有效的竞争技术出现,远程容灾及异地备份解决方案是EMC公司重要的竞争优势之一。
 基于存储系统的容灾模式可以通过智能存储设备镜像到远程备份中心的智能存储设备实现数据的安全保护。生产中心和备份中心的存储系统实现生产中心与备份中心之间数据的远程互为备份。保证在生产机房出现不可抗拒的灾难时关键数据不会丢失。在通信状况和备份中心计算机系统逐步完善情况下,也可以实现生产中心出现灾难后,直接启用备份中心替代生产系统,保障业务系统的不中断服务。
用户可根据需要远程保护的数据量来选择合适的智能存储设备。如果生产现场和备份现场相距较远,两地各有智能存储设备系统,连接方式可灵活使用 DWDMATMFDDI等,如果生产、备份现场连接距离在60公里以内,也可采用光纤直连方式。
 远程容灾解决方案已经应用于客户的许多重要应用领域,并为客户带来了真正的实惠。当今的商务活动每天24小时都离不开数据。如果由于维护、内部调整、系统升级,或是由于自然灾害或人为故障造成重要的业务数据无法访问,其代价将是巨大的,甚至关系到企业的存亡。所以,最重要的是要保证数据的持续可用性,以确保各种应用系统能不间断地服务于业务活动。远程容灾及异地备份解决方案可以应用于许多重要方面,下面所列出的只是其中的一部分:
    业务持续性:即使是在可能出现磁盘错误的情况下,也能保证业务应用程序的持续运行;
灾难恢复:灾难发生是,可以在几分钟(而不是几小时)内,在备份现场实现数据的恢复;
数据中心迁移:将应用程序的停止时间从数小时减少到了几分钟;
工作量迁移:于数据中心迁移类似,远程容灾及异地备份解决方案是进行常规的软硬件维护时缩短应用程序失效时间的理想手段;
工作量压缩或消除备份的处理时间:通过利用远程容灾及异地备份解决方案的第二数据拷贝缩短或消除备份的处理时间。
最后需要强调的是这种数据保护方式在存储层实现,是独立于网络层的,因而用根本不用担心网络访问控制对数据保护的破坏,因而具有很大优势。 
   
离线磁带备份方式的数据容灾方案在网络技术日益完善成熟的今天已经越来越不能满足广大用户的实时需求,尽管它还有其市场的价值, 在小规模非关键业务应用中还能常常看到,但总体讲其价值基本上是对在线磁盘备份的补充。
 在线磁盘备份方案可以从上面的对比分析中看到:网络远程备份仍然拥有其市场,它是一个替代磁带备份的比较经济的解决方案,适合小规模系统非关键业务需求;主机软件备份方案具有理论上的可行性,但在实践中暴露出许多问题,根本达不到设计要求;存储层数据备份镜像是目前业界的成功容灾解决方案,相比之下具有巨大优势,在国内外拥有广大用户群,成为真正系统容灾的首选。 
本项目我们推荐的数据备份方案就是基于磁盘阵列的数据备份解决方案。机遇磁盘阵列的数据备份解决方案在目前技术条件下是满足客户需求的唯一的解决方案,也是最佳的可行方案。
阅读(501) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~