分类:
2008-01-10 10:13:14
随着中国信息化水平不断提高,在信息安全领域的灾难备份以下简称灾备(Disaster Recovery),越来越成为人们关注的话题。这不仅是灾难本身的重要性,更是由于在建立灾备系统方面引发了不少争议:“在中国目前开发灾备业务时候为时尚早?”
“巨额投资应对小概率发生的事件,是否值得?”
“哪些用户需要做,应如何做?”
……
由此引发了对灾难备份的几点思考:
一、理解几个概念问题:
1、灾难:
从理论上讲:任何因不可预测的原因而导致系统非正常停机的事件都应该算是灾难,其中包括自然灾害(如地震、台风、水灾、火灾等)、基础设施的损害(如CPU损害、硬盘损害、建筑物倒塌、电源中断等)以及误操作(包括认为蓄意破坏等)。美国2001年发生的“9.11”事件是一起典型的灾难事件。
实际上,非常停机所造成的后果大不相同,如金融、民航等行业,信息化程度高,直接关系到公众切身利益和社会稳定,一旦出了问题,极易造成灾难事件;而有些行业或企业对IT系统依赖性不高或未涉及到关键业务,往往不易形成灾难事件。因此不同行业不同应用,对灾备需求程度并不一样。
2、灾备及其等级划分
灾备是指利用技术、管理手段以及相关资源确保的关键数据、关键数据处理系统和关键业务在灾难发生后可以恢复的过程。一个完整的灾备系统主要由数据备份系统、备份数据处理系统、备份通信网络系统和完善的灾难恢复计划所组成。
灾备等级划分,参照国际灾难备份行业的同行灾难备份等级划分原则,把灾难备份系统从低级到高级划分为七个等级:
等级零:无异地备份
等级一:备份介质异地存放
等级二:备份介质异地存放及备用场地
等级三:备份介质异地存放及备份中心
等级四:定时数据备份及备份中心
等级五:实时数据备份及备份中心
等级六:零数据丢失
用户选择哪一级灾备方案,要根据关键业务对IT依赖的程度,如什么样的数据必须在多长时间内恢复、哪种业务能承受多大的数据丢失等,都要分析清楚各种业务的实际需求。
3、大投入、小概率
大投入、小概率是灾备本质的特征,俗话说:“养兵千日,用兵一时。”花一大笔钱建起了灾备系统,可能几年也不出事,用不上,还要很多经费常年维持和发展更新。这个系统平时只能做些演练、检测和维修用,其他效益也难以发挥,只有当灾难来临的时候,方显其独特的威力。
二、灾备产业发展状况
纵观现状,中国灾备业务尚处在起步阶段,刚开始纳入正轨,以一家专为金融机构做灾备服务的企业来说,一年的收入才4000万人民币。据调查,目前我国除了一些金融机构部门灾备系统已经开始启动外,其他行业的灾备体系基础还非常薄弱。据报道,长天集团的灾备系统已在深圳证券交易所完成实施,并实现了预定的目标。当灾难发生时,位于同城异地的备份系统使现有应用结算系统级数据得以保护,并及时恢复业务运行。实施灾备时,系统运行一切正常,还能满足深交所日常维护的各种要求。能确保使计算机网络系统的稳定运行。
世界各国灾备产业发展很不平衡,信息化水平高的发达国家相对起步早,发展快。以美国为例,灾备业全球起步最早,始于上世纪50年代,灾备行业平均增长速度为17%,到目前为止,共完成了582宗灾难恢复。据统计,2001年的“9.11”事件中,蒙受毁灭性打击的企业共有1000多家,做了异地备份的当天就在其他地方恢复了办公,没有做灾备的,有的当时消失了,有的已逐渐倒闭和消亡。至少有一半以上没有做灾备的公司经过这场灾难后完全垮掉了。由此我们可以看到灾备的重要性是不容质疑的。另据专家称,国外的灾备业务,60%以上集中在金融领域。
三、建立灾备系统的重点是需求迫切的行业
早在2003年8月中办颁发的27号文件中就要求,各基础信息网络和重要系统建设要充分考虑抗毁性和灾难恢复,制定和不断完善信息安全应急处置预案。国家为此圈定了必须建立灾备基础设施的8个重点行业,其中包括金融、民航、税务、海关、铁路、证券、保险、电力行业。同时指出,灾难备份建设要从实际出发,提倡资源共享。互为备份。加强信息安全应急支援服务队伍建设。鼓励社会力量参与灾备实施建设和提供技术服务,提高信息安全应急响应能力。这是国家的客观指导政策,但是具体实施灾备项目,应把重点放在灾备需求迫切的行业和应用。比如国信办王瑜次司长所说:“我们不能完全一刀切,一窝蜂地要求必须投入巨资建立灾难备份系统,而必须根据各个行业的不同特点。考虑是否应该建,如何建,防止出现又一轮的信息安全投资过热,造成国家资金的浪费。”
例如海关平均每个小时进出口的货物物价价值在5亿美元左右,如果系统停了,后果特别严重。因此海关各关口都提出要做灾备,并已经开始实施,其中深圳海关的灾备中心,一小时之内就可以接管业务。还有银行、税务、民航和电力等关键行业系统,由于严重依赖信息化,目前都已经开始启动灾备的建设工作。
其他各行各业也是如此,有备无患这是普遍适用的思想,但实际需求是做灾备的前提,而不是有钱就做,钱紧就不做,更不应该是做不做存侥幸心理。或看人家做就做。一切要从实际出发,既要重视,又要理性。
四、如何建立有效的灾备系统
专家提出了灾备建设的6个基本流程:
1、建立灾备的专门机构
实施灾备应由董事会或高级管理层决策,指定高层管理人员组织实施。由科技、业务、财务、后勤支持等灾备相关部门组成专门机构。
2、分析灾备需求
重要的信息系统灾备需求包括对数据处理中心的风险分析,对业务进行分析以及确定灾难恢复目标。
3、制定灾备方案
灾备方案可以分为7个等级。一个完整的灾备方案的设计基于灾备需求分析所得出的各业务系统灾难恢复目标,就可以涉及各个级别的专用,并且考虑到技术手段、投资成本、管理方式等多方面的因素,主要内容包括:数据备份方案、备份处理系统。灾备中心建设、规程和管理制度。
4、实施灾备方案
按照所制定的灾备方案,完成灾备工作。实施过程中,要严格灾备方案的要求和内容进行。落实相关的规章制度、应用灾备方案、建设和运行灾备中心。
5、指定灾难恢复计划
其主要目的是规范灾难恢复流程,使重要的信息系统在灾难发生后就能够快速地恢复数据处理系统运行和业务运作,同时可以根据灾难恢复计划对其数据处理中心地灾难恢复能力进行测试,并讲灾难恢复计划作为相关人员培训内容之一。
6、保持灾难恢复计划持续可用
在灾难恢复计划制定以后,为保证计划的可用性和完整性,需要制定变更管理流程,定期审核制度和定期演练制度。
2004年《计算机世界》对部分厂商做了一个灾备方案综合评析,评析从需求分析到设计思路、方案实现到方案特点、方案效果到成功案例等,都做了比较客观的金石评价,其排名较前的厂商依次为天科思诺、IBM 、EMC、 HP和朝华科技等。用户更可以通过国内外已建立的灾备系统中获取宝贵的经验,把自己的灾备工作做得更好。
五、结语
建立灾备系统不仅仅使技术问题和巨额资金,还涉及到法律、标准、模式和机构改革等一系列问题,是一个比较复杂的系统工程。然而,我们不能等到各方面的条件都成熟了才去做灾备,而是要面对中国这样一个特殊的情况,用好国家宏观指导政策,借鉴别人的经验,把握现有的市场环境,走出一条适合我们国情、适合本系统的路子!
----摘自:关注灾难备份 IT168信息化专家委员会名誉主任 王文然
灾难恢复等级划分——摘自《重要信息系统灾难恢复指南》 在重要信息系统灾难恢复指南中,按照七个关键要素:数据备份系统、备用基础设施、备用数据处理系统、备用网络系统、技术支持能力、运行维护管理能力、灾难恢复预案,将灾难恢复划分为六个等级。
第1级 基本支持在第1级中,每周至少做一次完全数据备份,并且备份截至场外存放;同时还需要有符合介质存放的场地;单位要制定介质存取、验证和转储的管理制度,并按介质的性对备份数据进行定期的有效性验证;单位需要制定经过完整测试和演练的灾难恢复预案。
第2级 备用场地支持第2级灾难恢复应具有技术和管理支持如表1所示。
表1 第2级灾难恢复的技术和管理支持
要素
要求
数据备份系统
完全数据备份至少每周一次; 备份介质场外存放。 备用数据处理系统
灾难发生时能在预定时间内调配所需的数据处理设备到场。 备用网络系统
灾难发生时能在预定时间内调配所需的通信线路和网络设备到位。 备用基础设施
有符合介质存放条件的场地; 有满足信息系统和关键业务功能恢复运作要求的备用场地。 技术支持
—
运行维护支持
有介质存取、验证和转储管理制度; 按介质特性对备份数据进行定期的有效性验证; 有备用场地管理制度; 与相关厂商有符合灾难恢复时间要求的紧急供货协议; 与相关运营商有符合灾难恢复时间要求的备用通信线路协议。 灾难恢复预案
有相应的经过完整测试和演练的灾难恢复预案。 第3级 电子传输和部分设备支持第3级灾难恢复应具有技术和管理支持如表2所示。
表2 第3级灾难恢复的技术和管理支持
要素
要求
数据备份系统
完全数据备份至少每天一次; 备份介质场外存放; 每天多次利用通信网络将关键数据定时批量传送至备用场地。 备用数据处理系统
配备灾难恢复所需的部分数据处理设备。 备用网络系统
配备部分通信线路和相应的网络设备。 备用基础设施
有符合介质存放条件的场地; 有满足信息系统和关键业务功能恢复运作要求的场地。 技术支持
在备用场地有专职的计算机机房运行管理人员。 运行维护支持
按介质特性对备份数据进行定期的有效性验证; 有介质存取、验证和转储管理制度; 有备用计算机机房管理制度; 有备用数据处理设备硬件维护管理制度; 有电子传输数据备份系统运行管理制度。 灾难恢复预案
有相应的经过完整测试和演练的灾难恢复预案。
第4级 电子传输及完整设备支持第4级相对于第3级中的部分数据处理和网络设备而言,须配置灾难恢复所需要的全部数据处理设备、通信线路和网络设备,并处于就绪状态;备用场地也提出了支持7×24小时运行的高要求;同时,对技术支持人员的运维管理要求也有相应的提高。
第5级 实时数据传输及完整设备支持第五级灾难恢复应具有技术和管理支持如表3所示。
表3 第5级灾难恢复的技术和管理支持
要素
要求
数据备份系统
完全数据备份至少每天一次; 备份介质场外存放; 采用远程数据复制技术,并利用通信网络将关键数据实时复制到备份场地。 备用数据处理系统
配备灾难恢复所需的全部数据处理设备,并处于就绪或运行状态。 备用网络系统
配备灾难恢复所需的通信线路; 配备灾难恢复所需的网络设备,并处于就绪状态; 具备通信网络自动或集中切换能力。 备用基础设施
有符合介质存放条件的备用场地; 有符合备用数据处理系统和备用网络设备运行要求的场地; 有满足关键业务功能恢复运作要求的场地; 以上场地应保持7 x 24运作。 技术支持
在备用场地有:
7×24专职计算机机房管理人员; 7×24专职数据备份技术支持人员; 7×24专职硬件、网络技术支持人员。 运行维护支持
有介质存取、验证和转储管理制度; 按介质特性对备份数据进行定期的有效性验证; 有备用计算机机房运行管理制度; 有硬件和网络运行管理制度; 有实时数据备份系统运行管理制度。 灾难恢复预案
有相应的经过完整测试和演练的灾难恢复预案。
第6级 数据零丢失和远程集群支持第6级相对于第5级的实时数据复制而言,要求实现远程数据实时备份,实现零丢失;备用数据处理系统具备与生产数据处理系统一直的处理能力并完全兼容,应用软件是集群的,可以实现实时无缝切换,并具备远程集群系统的实时监控和自动切换能力;对于备用网络系统的要求也加强,要求最终用户可通过网络同时接入主、备中心;备用场地还要7×24专职操作系统、数据库和应用软件的技术支持人员,具备完善、严格的运行管理制度。