Chinaunix首页 | 论坛 | 博客
  • 博客访问: 11491373
  • 博文数量: 8065
  • 博客积分: 10002
  • 博客等级: 中将
  • 技术积分: 96708
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-16 17:06
文章分类

全部博文(8065)

文章存档

2008年(8065)

分类: 服务器与存储

2008-07-17 09:59:42

灾难为很多好来坞电影提供了素材,银幕上涌现出了无数的英雄形象。然而,具有讽刺意味的是,在现实生活中,好来坞一家电影工作室的IT系统亲身经历了一场灾难——计算机房供电的外部变压器发生了短路并引起了爆炸。



该工作室的处理器中包含的应用程序关系到公司主要有线电视台的播放时间安排以及国内娱乐节目、镭射光盘和交互式游戏程序的制作、发行和整理。尽管IT系统出现问题不会使整个工作室处于崩溃的局面,但考虑到潜在的时间和金钱上的损失,这也足以称得上一场大灾难。

令人感到遗憾的是,该工作室并没有可靠的灾难恢复计划,尽管灾难发生不久人们就意识到了它的价值。

Rick Schiesser接受了制定灾难恢复计划的委托,感兴趣的用户可以下载他的文章“制定有效的灾难恢复计划”。他在文档的开头讲述了从该工作室的灾难中所得到的启示,包括“灾难”是由什么造成的、灾难恢复同业务继续在概念上的区别以及如何利用灾难恢复时间。他还同时在文档中提出了制定有效的灾难恢复计划的十个步骤。这些步骤包括:


获得管理层的支持:这一点是非常重要的,因为所有的资金投入都要得到高级管理层的通过。高级管理层的介入可以确保灾难发生时能够从他们那里得到思想和财政上的支持。

选定负责人:潜在的人选包括业务主管、数据中心主管甚至是基础设施管理人员。

进行业务影响分析:如果要在一个灾难恢复计划中包含所有的业务过程和应用程序,那么这个计划能够为企业带来的价值还抵不上它所耗费的成本,因此要通过分析选出那些关键的业务过程。

评定保持业务连续性的战略:这项评定包括公司内部有代表性的远程站点和外部供应商提供的冷站(Cold sites)(注)。

计划并实行常规测试:一些进步的公司每年要对灾难恢复计划进行三到四次测试。
Rick Schiesser在IT基础设施的管理和咨询方面有着丰富的经验。在这篇可供用户下载的文章中,他还向大家介绍了一些不愉快的经历,以此来显示计划、准备和实行对于一个好的灾难恢复计划来说是多么的关键。

如果你正受命为公司制定灾难恢复计划,那么前人的经验会对你大有帮助的。

注:冷站(Cold sites)和热站(Hot Site)
大多数服务器风险恢复计划的核心是物理隔离。数据(常常包括服务器)一般是异地保存的,与公司的日常办公地点相隔离,这样,一些内容的灾难事故就不会损坏他们。

存储这些设备的地点一般被称为恢复中心(recovery site)。它们至少被分为两类:

热站(Hot Site):在这里,服务器,数据与应用程序与主服务器随时同步(镜象)运行,这样灾难恢复是过程极其快速,几乎难以被觉查。但由于这种方案意味着软硬件的重复投资,因此这种方案一般投资高昂。

冷站(Cold Site):数据,应用程序及服务器是平时处于准备就绪状态,并以一定的频率更新与主站保持同步。当灾难恢复时这此些系统要经过一段时间调试才能投入使用,因些故障恢复时间是以小时甚至天数来衡量的,这个方案相对比较昂贵(取决于所需的设备),当然,它比热站方式要便宜些。
阅读(279) | 评论(0) | 转发(0) |
0

上一篇:网络经典命令行

下一篇:光纤的分类

给主人留下些什么吧!~~