数据库高级专家。国内顶尖数据专家,出版数据专著多部,发表数据论文多篇,近年参与多项金融、国防、电信等大型数据工程。 http://www.china-pub.com/main/sale/renwu/luminary.asp?id=9608
分类: 系统运维
2013-05-28 06:58:59
数据灾难,对重要的数据系统历来是潜在的巨大威胁,这些灾难可能源于自然灾害、恐怖袭击、员工的错误(或恶意)行为或硬件故障。越来越多的公司都在重新审查他们的容灾计划能否应对灾难。
丢失数据的后果相当严重。目前,更多的公司以电子的形式记录信息。公司越来越依赖这些记录,越来越依赖用于处理和存储数据的工具。人们从来不会打印电子邮件、事务处理等大多数电子记录。电子记录一旦丢失,就不可能重新创建。而大部分公司都不允许丢失数据。
现在我们讨论一下提高灾难恢复能力的话题。
灾难恢复计划必须包括如下三点:
必须保护备份数据。例如,在当地磁带驱动器中设置一个备份磁带,用以存储数据,这种方法在整个数据中心着火的时候就不实用了。你需要在其它地点另外设置备份复本。
必须能通过备份使公司恢复运作。如果某个站点被收到洪水等自然灾害威胁,就必须保证某个受保护的站点拥有足够的数据,使公司能继续正常运作。对大多数公司而言,数据虽然不代表整个公司,但是却支撑着整个公司的运转。
恢复进程必须在公司需求描述的时间框架内正确地运行。如果你不能使公司再次运作——或者需要花费几周时间才能修复磁带数据,那么只是简单地实行远程备份毫无意义。
明白了这几点对公司恢复需求的重要性后,你就可以开始制定灾难恢复战略了。
战略和公司需求
制定灾难恢复战略(有时也称业务连续性计划或BCP)有许多种方法,保护公司运作也不止一种正确的方法。一家公司制定的战略和程序可能对另一家公司就不适用。但是,实现灾难恢复计划有一些常见的方法。
异地磁带备份是最传统的方法,即数据中心或远程办公室中会定期备份数据。然后,复制备份磁带,将其转移到一个安全的站点,其中网络管理产品就是这么工作的。可以根据循环周期定期召回磁带,或者需要恢复时也可以召回磁带。
远程磁盘复制越来越流行,数据中心的资源定期复制到远程站点相同的存储资源中。银行可能会通过WAN链接将存储中的内容复制到远程站点的Centera中。这样,就具有双倍的资源,恢复速度也大于磁带;如果实施得当,还能在主站点失效时,接管主存储站点。
制定灾难计划的应对战略时,通常要考虑成本因素。这种形式与保险相似:你在花钱避免更大的经济损失。数据保护模式非常复杂,具有一定的成本,而你在努力降低潜在损失,最终目标是要将两者协调。所以,一家小型医疗公司也需要每周进行异地磁带备份,因为可能无力支付更贵的恢复需求;一家全天候工作的全球互联网供应商需要复制一个数据中心,因为宕机时期的损失远高于灾难恢复战略的成本。请牢记上文所提必需条件的第三条:恢复必须在时间框架内完成,与公司的恢复需求或ROI保持一致。要想在紧张的恢复时间目标(RTO)内获取大量数据,必须精心制定恢复战略。
工具和产品
你选择的数据保护解决方案应该体现你的恢复战略,应根据公司的恢复需求而定。如果选用磁带作为备份和恢复介质,你可以选择与磁带驱动器平台兼容的备份/恢复软件。有几种方案举例,比如Symantec (Veritas) NetBackup、EMC NetWorker和IBM Tivoli Storage Manager等大型数据中心的产品。
许多灾难恢复战略要求在存储阵列之间进行复制,可以由阵列生产商提供的软件来完成这项工作。EMC公司的Symmetrix远程数据设备可以在Symmetrix系统之间复制数据。IBM公司采用点对点远程复本在IBM阵列之间实现复制。Hitachi数据系统公司采用TrueCopy在HDS阵列之间实现复制。但是,你也不是非得采用硬件式复制软件,FalconStor Software、 NSI Software和Kashya (现属于EMC)等公司提供的工具可以在不同的存储阵列之间实现复制。
公司如果缺少资源管理灾难恢复站点,可以将灾难恢复任务外包给第三方服务供应商,按月支付费用即可。
灾难恢复战略并不能“以一应十”。实施分层灾难恢复战略意义重大,这样就可以联合使用磁带备份、磁盘备份和数据复制。并非所有的商业流程对公司的生存都具有同等重要的作用,因此,不同流程支持的系统和数据具有不同的恢复优先权。
文档的管理
灾难就意味着危机,在这场危机中,你没有时间查找各种磁带,没有时间规划如何重建备份环境。我们需强调,必须具有全面、及时更新的文档。这些文档应该包括:系统准备工作的说明书、恢复步骤、正常运作恢复之前对数据中心进行后期恢复测试/确认。文档还应该包括联系信息(如管理员电话、服务部门联系方式等)或访问密码。文档应属于灾难恢复计划的一部分。恢复计划应有多份复本,每分复本由专职IT人员或管理人员保管。同时请注意:严格控制恢复计划的版本,保证人员只能获得最新版本。