Chinaunix首页 | 论坛 | 博客
  • 博客访问: 11590919
  • 博文数量: 8065
  • 博客积分: 10002
  • 博客等级: 中将
  • 技术积分: 96708
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-16 17:06
文章分类

全部博文(8065)

文章存档

2008年(8065)

分类: 服务器与存储

2008-07-21 16:00:36

    9.11后,无论计算机用户还是IT业者谈论系统灾难备援的都比较多。由于以前少有涉及,很多人即使是资深的技术人员对DRP或者BCP均只知道个大概,难有详细了解的机会。本文将常用的几种灾备方式的比较,抛砖引玉,帮助对灾备方式进行正确的理解与决策。
      随着计算机系统越来越多的使用,系统的复杂度与关键性也与日俱增。企业灾备方案也越来越多地提上议事日程。在确定方案的过程中,如何选择一套最适合自已的灾备方式,对灾备效果,资金投入有着至关重要的意义。本文对业界常用的几种灾备方式进行比较,希望在确定备份方案时能对你有所帮助。

1.       主流的灾备方式
1)        基于存储。目前主流的存储设备厂商在其存储产品上均有基于存储设备的灾备解决方案,如EMC的SRDF, IBM的PPRC。这种解决方案是一种数据存储的物理镜像,它将数据在物理层面上,在两套存储设备中通过SAN制作或生成两套数据镜像。这两套存储设备可以是本地的,也可以是远程的。当本地的生产系统发生故障时,备份系统主机可以连接上备份存储系统,开启业务。
2)        基于操作系统。有些操作系统如AIX他本身就具有数据跨存储设备的镜像功能。与本机硬盘单镜像设置的不同,这种灾备方式可以由操作系统通过SAN发起在两个存储设备间保存两份相同的数据。当本地的生产系统发生故障时,备份系统主机可以连接上备份存储系统,开启业务。
3)        基于应用软件。大多数系统或者数据库均有基于应用层的软件灾备解决方案。在AS/400上有MIMIX,OMS,在AIX上有HAGEO, 在WINDOWS平台上有Veritas,还有针对不同的数据管理系统本身一般均有数据同步复制模块,均是实现软件灾备的解决方案。这种解决方案一般通过日志功能,将数据的更新动作通过网络如实地复制到本地或者远程的备份系统。当本地的生产系统发生故障时,备份系统主机无须重新启动,直接可以开启业务。
4)        磁带冷备份。将生产系统的每日备份磁带定期送到安全的地方或者远程的备份机房。当本地的生产系统发生故障时,备份系统主机恢复磁带,然后开启业务。

2.       灾备效果的衡量指标
企业灾备系统的建设是一种专业性很强的工作。灾备系统往往是在关键时刻起着牵系企业生存命脉的救命稻草似的作用,所以灾备系统的完善程度也有一套科学的衡量指标。

2.1. 指标一:RTO (Recovery Time Objective)
RTO,Recovery Time Objective,是指灾难发生后,从I/T系统当机导致业务停顿之刻开始,到IT系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。
一般而言,RTO时间越短,即意味要求在更短的时间内恢复至可使用状态。虽然从管理的角度而言,RTO时间越短越好,但是,这同时也意味着更多成本的投入,即可能需要购买更快的存储设备或高可用性软件。

2.2. 指标二:RPO (Recovery  Point Objective)
RPO,Recovery Point Objective,是指从系统和应用数据而言,要实现能够恢复至可以支持各部门业务运作,系统及生产数据应恢复到怎样的更新程度。这种更新程度可以是上一周的备份数据,也可以是上一次交易的实时数据。
与RTO目标不同,RPO目标的确定不是依赖于企业业务规模,而是决定于企业业务的性质和业务操作依赖于数据的程度。因此,RPO目标对相同行业的企业而言会有些接近,而对于不同行业的企业来说仍可能会有较大差距。

2.3.       灾备解决方案的七个级别
灾难备援技术方案的七个级别:7 Tiers for Disaster Recovery Solution,是指根据国际标准SHARE 78的定义,灾难备援技术方案可以根据以下主要方面所达到的程度而分为七级,
¨         备份/恢复的范围
¨         灾难恢复计划的状态
¨         应用站点与备援站点之间的距离
¨         应用站点与备援站点之间是如何相互连接的
¨         数据是怎样在两个站点之间传送的
¨         允许有多少数据被丢失
¨         怎样保证更新的数据在备援站点被更新
¨         备援站点可以开始备援工作的能力
     即从低到高有七种不同层次的灾难恢复解决方案。
如下图所示,该七个级别的灾难备援的技术方案分别是:





¨   Tier 1 - PTAM“卡车”运送访问方式 (Pickup Truck Access Method)
¨   Tier 2 - PTAM卡车运送访问方式+热备份站点 (PTAM + Hotsite)
¨   Tier 3 - 电子链接方式 (Electronic Vaulting)
¨   Tier 4 - 数据库镜像和日志方式 (Batch/Online Database Shadowing & Journaling)
¨   Tier 5 - 两点两阶段提交 (Two-Site Two-Phase Commit)
¨   Tier 6 - 无数据丢失 (Zero Data Loss)
¨   Tier 7 - 无数据丢失和应用自动切管 (Zero Data Loss + App Automatic takeover)

  
3.       主流灾备方式的比较
对照前述的主流灾备方式与灾备方案的衡量指标。我们不难发现:

3.1.       数据镜像解决方案
典型方案:
1.       EMC 的SRDF,
2.       IBM 的 PPRC
3.       AIX操作系统数据镜像,
优点:
1.       属于Tier 6灾备级别的解决方案。
2.       它可以在30-60分钟内恢复系统。
3.       实时数据同步,提供交易级的数据安全性。
4.       管理简单
缺点:
1.       投资大,需要增购存储设备
2.       主备机距离不可太大
3.       对AS/400来讲没有操作系统数据镜像
4.       对AS/400来讲,对主机硬件的配置限制较大。

实用性分析
当灾难发生时,使用本解决方案的灾备系统可以在60分钟内启动工作,提供交易级的数据安全,且管理比较简单方便,在主备机距离不是很大的情况下,很适合对业务可用性有很高要求,且可用预算较高的企业使用。

3.2.       应用软件的灾备解决方案
典型方案
1.       MIMIX for AS/400
2.       OMS for AS/400
3.       Veritas for Windows
4.       各种数据库的实时复制
优点:
1.       属于Tier 4 – Tier 5灾备级别的解决方案。
2.       它可以在2-8小时内恢复系统。
3.       数据几乎实时同步,提供日志级的数据安全性。
4.       主备机间无距离限制
缺点:
1.       需要保证主备机间的网络性能
2.       管理相对复杂,需要应用配合发挥最大功能

实用性分析
当灾难发生时,使用本解决方案的灾备系统可以在2-8小时内启动工作,提供日志级的数据安全,比较适合有性能良好的网络环境,有一定技术力量,技术人员理解AS/400的工作原理与具有一定的系统管理水平,同时对业务可用性也有很高要求的单位使用。

3.3.       磁带冷备份解决方案
优点:
1.       投资最省
2.       操作简单
缺点:
1.       当灾难发生时,它一般需要24-72小时才能恢复系统。
2.       当灾难发生时,最多会丢失24小时的生产数据
3.       主备机间距离的距离不可超过磁带有效运送的距离
4.       对磁带机设备的可靠性存在严重依赖
5.       日常管理的工作量大

实用性分析
当灾难发生时,使用本解决方案的灾备系统需要24-72小时才能启动工作,最多会丢失最近24小时的生产数据。比较适合预算有限,对系统高可用性要求不高的制造业企业采用。
阅读(1760) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~