地震中,有一个县民政局的24位职员中有16位遇难,还有很多人受伤,这个基层民政系统就处于瘫痪状态,而外来的人员对这些部门的信息系统不能完全掌握,因此,民政系统以及其他政府机构的数据信息如何进行灾难备份,应该吸取什么教训呢?
点击浏览访谈视频
用标准应对灾难
“北京、上海、广州、深圳等一些大城市的准备工作,做得早一些。而二级三级城市在这方面做得还不太多,很容易发生在灾难中丢失数据、信息系统长时间不能够运作的情况。” 汪琪说。
而在国家标准当中,有一个信息系统灾难恢复规范——《信息系统灾难恢复规范》,参与过这套规范制定的汪琪介绍说:它是一部技术类的标准,由我国安全化标准委员会在去年正式颁发,标准号叫做GBT20988,这是国信办从2004年牵头,召集了8大重点行业,包括银行、铁路、交通、税务、海关等等一些重点信息行业、几地的市政府、基础运营企业以及一些专业机构进行制定的。
因为信息系统越来越成为整个社会的基础运行保障的最重要环节。信息系统的灾难恢复是所有的灾难恢复当中比较迫切的,而且建成了之后效用体现最明显。2005年,国信办以文件的形式正式下发这套规范,下发到8大重点行业之后,各个行业都进行了转发,之后这套指南提交给了中国信息安全标准化委员会,最终形成了GBT的国标。
同时,由于社会、行业的多元化,想以一个标准或一个文件来规范所有的企业、政府和组织不太可能,因此这个技术类的标准实际上是一套技术规范和技术流程,是总结了国内国外这几十年在灾难恢复方面的一些最佳实践的理论方法。
这套标准的亮点之一就是它的分级。第一次把信息系统的灾难恢复能力做了一个等级划分,从1到6,总共6个等级。第二给了人们非常好的可执行性。各个行业拿了这个标准之后,可以制定自己的行业管理规范,比如说银行业,第一类核心业务系统必须达到第5级,第5级是什么,不用说了全社会认可的国标,大家看这个国标就可以了。
1
银行如何快速恢复?
我国在做灾难恢复方面最快的行业是银行体系。金融行业最早从2002年就开始提出,银行信息系统要建设灾难恢复的能力,2006年,人民银行和银监会也都出了标准,2007年出了一个银行业的管理规范,行业主管部门一直在推进。
业务连续国际组织DRI International培训专家汪琪(中)做客IT168高端访谈
这次地震当中有一家银行的位于都江堰支行的6层大楼倒塌,这又涉及到业务连续中断的问题。对于倒塌的这家支行来讲,其真正的后台处理系统由于已经实现了数据大集中,应该没有问题,它最大的问题是整个工作场所没有动,发生了灾难性毁灭。
对于这家支行来说,如果在灾难发生前做准备工作,它应该是对整个支行的业务做评估,做分析,然后看看有哪些业务在灾难后可能遭到中断,哪些需要恢复:比如4小时内必须恢复的,8小时内必须恢复的,24小时内必须恢复的,7天内必须恢复的,进行一个排序。排出来之后再看看每一项业务做恢复的时候,需要用到的人力资源有多少、IT资源有多少、服务渠道、服务界面有多少等等,同时在其他地方,做一套物质保障条件,真正灾难发生的时候,可以把业务在其他支行做业务,然后在这基础上每年进行演练。如果真能做到了以上这些,这家银行的人员可以到事先所设定到的地方,把资源拿来,把后台的IT系统接上,就可以对外提供服务了。
演练有多难?
演练是应灾防御准备过程中一个重要的方式,但平时的演练很难模拟到灾难的具体情况,那演练还有什么作用呢?
汪琪告诉记者,演练在专业上分很多种,基本的有桌面演练,还有模拟演练,最高层面是实际切换的演练。桌面演练就是把流程预案准备好,把人员准备好,把整个过程在纸上、笔上、口头上整个走一遍,看有没有什么问题。而模拟演练就是模拟一个场景,在这个场景下检查流程制度、检查切换手册|检查信息系统,而实际切换演练就是真正切换到现实场景中,进行真正的实地演练。
而切换演练在现实中的难度很大,因为企业不可能为此停下正常的工作流程,该怎么办呢?切换演练的时候一定要遵循几个原则,第一不影响到正常的生产。可行的办法是选择一个时间点,把这个时间点的整个环境做一份克隆,在建立好的环境下做演练,这样就最大程度地模拟了生产环节。
在这个演练过程中,仅仅是数据通过克隆的方式拿过来了,其他的环节,包括灾难恢复的设备、网络、预案、参与人员及各个分支机构等都是真实参与的。在这个基础上,模拟所有的交易,最终再把生产和灾备演练两个过程进行核对,看看两边是否一致。
1
阅读(1292) | 评论(0) | 转发(0) |