分类: 服务器与存储
2008-06-22 16:32:25
灾备演练是验证灾难发生时,业务系统能否有效联动切换的极为重要的手段。没有灾备的演练计划和手段,往往无法预知灾难发生时生产中心和灾备中心的数据一致性,也无法预知灾备中心是否具有了业务接管的一切必要条件。以往,由于一些企业采用的容灾技术实现不具有灾备演练的技术手段,出现了一些企业在故障发生时,仍然无法启动后援系统进行业务接管的现象,这些企业不得不仍然采用传统的备份恢复方式进行耗时的数据恢复,不仅出现了大量的数据丢失,而且动辄数十小时的业务停顿,也使得灾备系统的设计者狼狈不堪。
因此,选择有效灾备技术手段的同时,决不能忽略灾备演练技术手段的提供,在具有多种技术手段的基础上,制定灾备系统的演练和测试计划。灾备的演练计划有以下几种方式:
灾难恢复计划要求建立业务连续性管理团队,不仅涉及IT部门,而且关联众多业务部门,为减少演练对于生产的影响,可以将恢复计划细化到很小的单位或者模块,逐个应用进行接管验证。当模块都成功通过测试后,测试的范围可以扩充到更多的模块。
突发演练
在灾备系统全面完成并且制定了全面的恢复计划后,可以在进行了一定备份的情况下安排突发性的测试。当然,业务连续性管理小组需要确保业务不会因为突发性测试造成不可接受的损失和业务中断。
演练对于提高团队的恢复经验和协作能力以及确保灾难恢复计划的可行性是至关重要的。所有的演练结果都要进行评估、记录,并且生成到容灾流程里。
容灾建设的要素还有很多,全面考虑业务连续性体系的每一个方面,抓住最为重要的环节,进行深入而细致的研究,就能够使有限的资金发挥更大的能量,达到事半功倍的效果。(作者系美国飞康软件公司中国区技术总监)