分类: 服务器与存储
2008-06-15 04:23:05
如今,越来越多的企业开始关注如何保证在灾难中业务不中断,但是灾难恢复计划(DRP)只是亡羊补牢。
地球环境日趋恶劣,各种大的灾难频繁降临在你我身边,越来越多的企业开始关注如何保证在灾难中业务不中断,实施业务连续管理将成为众多企业的首选。
BCM与DRP、BCP的关系
灾难恢复计划(DRP)不过是亡羊补牢,业务连续性计划(BCP)和业务连续管理(BCM)才是真正的未雨绸缪。相对于连蜡烛都找不着的店铺,有发电机的老板就是有战略的;相对于全店人都忙着折腾发电机,还找不到柴油的店铺,事先要厨娘们各司其职,让两个熟练的门僮伺候发电机的老板就是有战略的。
DRP的核心是IT的备份与恢复,还包括围绕IT备份与恢复的灾难恢复资源、灾备中心的运营管理和切换、重续运行与回退预案几部分内容,它面向信息系统及所支持的业务功能,从灾难造成的故障或瘫痪状态恢复到可接受状态。BCP在DRP的基础上增加了业务影响风险分析、业务恢复预案、恢复策略与方案和人员架构组织保障的内容,它面向企业关键业务持续、有效运作,是灾难事故的预防和反应机制。BCM又把BCP的外延内容扩大到了紧急事件的应急响应处理、危机通讯与危机公关、灾难事件应急响应处理和供应链或关联单位的危机管理,它面向企业潜在的风险,考虑内部风险控制及外部利益相关单位,建立一个完善的机制预防或减少损失。
BCM实施流程方法论
业务连续管理(BCM)是循环往复的生命周期过程,也是持续改进的过程。其实施应该采用通用的项目管理方法。它总共包括五个流程阶段。
分析评估阶段是通过风险分析和业务影响分析,得出业务连续管理的目标和需求。
架构设计阶段是根据分析评估得出的结果,进行恢复策略分析和信息系统方案的制定。恢复策略分析从业务恢复策略、渠道恢复策略、分支机构恢复策略和恢复等级要素等方面进行具体的介绍,信息系统方案则从数据备份/复制、备份数据处理系统和网络切换等方面阐述。
开发实施阶段将从应急响应预案、灾难恢复预案、业务恢复预案、重续运行计划及其回退计划等方面阐述预案开发的内容,从灾难备份中心的操作管理、变更管理、安全管理、问题管理、应急管理、演练管理和服务水平协议管理等方面详细说明灾难备份中心的运营管理方式。启动管理阶段主要包括划分演练类型、演练各阶段过程介绍和对预案的有效性进行测评。
持续维护阶段是对于预案进行维护、审核和更新的阶段。其主要内容包括对预案的日常维护,从业务连续能力、政策的合规性和国际标准的达标情况等方面对整个方案进行全面审计检查,还包括所有的业务连续管理过程中的各种培训。
应用锦囊
灾难恢复建设的方式主要有三种:自建、共建和外包。
自建是指单位自己拥有并操作灾难恢复设施,有自己的灾难恢复运营和管理团队。共建是指多个单位共同出资建设灾备中心,在这些单位内部互相提供灾备服务。外包是指单位选择外部专业技术与服务资源,以替代内部资源来承担灾难恢复系统的规划、建设、运营、管理和维护,比如租用灾难备份场地、设备,将灾备运营维护交于灾难恢复服务商、服务商协助应急恢复等形式。灾难恢复建设投资巨大,并且使用概率较低,因此,需要根据自身实际情况,对灾难恢复建设的总体投入成本(TCO)和投资回报率(ROI)进行认真分析和计算,从而确定灾难恢复资源的获取方式。
在灾难恢复建设外包过程中,用户还可根据自身实际情况,在灾难恢复系统的投资模式、灾难恢复资源使用模式和灾难恢复系统的运营管理模式方面进行合理选择。例如:灾难恢复系统投资模式,灾难恢复系统由外包服务商投资建设和运营管理,用户整体租用;用户自己投资或双方共同投资,外包服务商负责提供托管服务等。
灾难恢复外包服务
专业的灾难恢复外包服务,整体上应该包括专业咨询、灾难备份系统设计及实施和灾难备份中心服务这三方面内容。其中,专业咨询包括项目启动和组织架构建设、需求分析——风险分析和业务分析,确定灾难备份策略等内容;灾难备份系统设计及实施的服务包括灾难备份系统设计、灾难备份系统投资及实施、灾难恢复计划制定等;灾难备份中心的服务内容包括灾难备份中心(机房场地/数据处理/设备网络接入/业务连续性资源)、灾难备份中心运营管理、灾难恢复计划演练及维护、灾难恢复及技术支持等。
灾难备份中心的建设
灾难备份中心是用于灾难发生时接替生产系统运行,进行数据处理和支持关键业务功能运作的场所。它用来提供稳定的、长期的数据备份与灾难恢复服务,更侧重于如何提高灾难恢复能力。灾难备份中心在选址要求、建设规划和运营管理方面都不同于生产中心。
灾难备份中心的主要选址原则:策略性——明确对灾难备份中心的定位,即灾难备份中心的建设目的是防范什么样的灾难事件,在灾难发生的时候又能够提供何种服务;风险性——选择或建设灾难备份中心时,要注意备选的场址所包含的风险是否在单位能容忍的风险范围之内,或是符合灾难恢复规划、业务连续计划的要求,考虑生产中心与灾难备份中心之间应保持适当地距离,避免因同一灾难导致两个中心同时处于灾难事件当中;科学性——选择或建设灾难备份中心时,应对备选的场址进行相关的场地风险分析,科学、全面地评价各备选的场址;适合性——对于选定的场址而言,首先要符合GB/T 2887-2000《电子计算机场地通用规范》的要求,还要关注场址周边环境、地质地理条件、市政配套条件、电力供应条件、通讯服务商所能提供的服务能力等诸多因素。