Chinaunix首页 | 论坛 | 博客
  • 博客访问: 680035
  • 博文数量: 535
  • 博客积分: 9970
  • 博客等级: 中将
  • 技术积分: 7260
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-15 03:47
文章分类

全部博文(535)

文章存档

2011年(1)

2008年(534)

我的朋友

分类: 服务器与存储

2008-06-22 23:00:58

      通常,异地容灾方案需要从三个不同层次进行分析,如基础设施层、数据层和应用层。基础设施层包括通讯设备、线路、交换机、服务器、FC交换机、磁盘阵列等设备以及互相连接的线路、网络系统等,数据层是指需要在两地之间进行基于物理设备层进行远程复制的数据,应用层指基于设备和数据层能够运行相关的业务应用。由于RecoverPoint的工作主要是在数据层,因此我们下面的讨论也主要是讨论在数据层上RecoverPoint的功能、特点和优势。
用户需求

 


图一:用户主数据中心SAN网络拓扑

   图一为用户SAN主数据中心存储网络拓扑示意图。图中HP EVA 3000通过Brocade光纤通道交换机与2台主机HP 9000小型机相连,集中存储了所有业务关键数据。
   该用户SAN存储备份系统投入运行以后,极大地改善了用户的应用运行环境,提高了系统的稳定性、可靠性和工作效率,具有以下意义:
    实现了数据集中存储,提高了数据存储的可靠性和可管理性。
    优化了应用系统结构,提高了系统运行效率。
    实现了数据的统一备份,简化了管理程序。
   随着用户网络应用的不断扩展,用户数量的不断扩大,集中在磁盘子系统中的数据量也越来越大,越来越重要,因此需要考虑在灾难情况下数据中心的数据安全性问题。
   用户的应用环境情况:
    A、服务器种类:有HP等品牌
    B、光纤通道交换机:博科
    C、存储种类:HP EVA 3000 盘阵
    D、操作系统:有HP Unix等
    E、应用系统:基于Oracle DB的应用系统等
    F、网络环境:千兆以太网
   用户的数据容灾的目标:
    A、在主站点和容灾站点之间进行远距离数据复制,可以从几十公里到数千公里
    B、具有实时从数据错误和区域性灾难中恢复的能力
    C、高效利用广域网带宽,节约成本
    D、与现存网络基础设施无缝集成
    E、对容灾站点的存储设备没有品牌的强制性要求,便于未来扩展
用户需求分析
   从用户的需求来看,我们可以从容灾的三个层次来分析用户需求,重点放在数据层的需求上。
   1、基础设施层
   在完成满足上述3.1节的基本设计原则的前提下,提供给用户选择的硬件设备的品牌并不多。服务器的选择,需要考虑应用层的恢复,可能只能够选择相同品牌的产品及服务的时候;由于在绝大多数情况下,容灾中心的服务器主要工作在等待状态下,因此,用户可以根据投资情况,充分考虑是否需要配置双机热备份。容灾站点采用了与主站点相同的服务器配置,可以保证应用性能在灾难发生时完全能够完全替代主站点的工作。
   SAN交换机可以根据服务器的情况,同样考虑是否需要双机热备份。
   由于容灾中心的使用率从总体角度上看非常低,因此磁盘阵列也可以适当选择性能稍低的产品,如HP的DS4000等,以降低总体拥有成本(TCO)。
   企业级的远程容灾中项目中,远程传输线路的投资非常高,因此需要慎重考虑。在本项目中已经选择采用现有的千兆光纤租用线路。
   2、数据层
   数据层需要考虑的主要问题有:
   RPO(数据容许滞后时间),从用户的角度看,网络上拥有不同种类的应用,允许的RPO时间不完全相同,但是对应整个系统容灾的角度来看,需要达到的RPO值,是所有应用中能够允许的最小的RPO值。因此,应该以系统中实时业务系统的RPO值设定为容灾系统的RPO值。例如,基于Oracle数据库关键业务系统能够容许的最大业务滞后时间为1分钟,我们对应系统的RPO值就设定为1分钟。
   RTO(数据恢复时间),同样以实时业务系统的RTO值设定为容灾系统的RTO值。例如,基于Oracle数据库关键业务系统系统能够容许的最大数据恢复时间为30分钟,我们对应系统的RTO值就设定为30分钟。值得注意的时,由于系统恢复的过程,往往需要人工进行干预,因此,必须将人为因素一并考虑在整个系统恢复过程中。
数据的一致性
   对于事务性的应用,简单将磁盘的块写进行复制并不能够保证数据的一致性,因为,很有可能的一个情况就是发生差错或灾难的时刻,一个完整的交易并没有全部完成。因此,该时刻的写盘数据不能够保证数据的一致性,这是基于磁盘块复制技术的一个缺点。从目前用户系统看,多种应用同时存在于该系统中,因此,如何保证数据的一致性,是该方案中一个非常重要的技术要点。RecoverPoint在对于数据的一致性上面,具有独特的优势,不但能够保证单一应用情况下数据的一致性,更加重要的是能够在由于多个应用组成同时的复制中,保证所有应用数据的一致性。
数据传输量
   数据传输量的大小与客户应用密切相关,直接影响到传输带宽需求,与带宽成正比,与RPO/RTO成反比。用户必须统计当前应用情况下,每日数据传输量的大小,并预估企业的发展情况,形成数据传输量的报告,并作为方案设计的重要依据。基于成本考虑,在传输数据时,能否具有比较高的数据压缩率的方案,是用户重点考量的内容之一。
容灾系统的可管理性
   容灾系统必须能够非常方便地被管理。系统的各层面的运行情况能够从图形界面中清楚地查看,系统的历史情况和各种指标能够方便形成报表,系统的告警能够通过不同方式对管理员报告等。
   3、应用层
   用户网络上的应用分两大种类,生产性业务应用系统和企业管理应用系统。虽然两类系统对实时性的要求略有差异,但是从系统的重要性来看,都是非常重要。
   应用系统的对容灾要求主要有以下几点:
系统的实时性
   两类系统对实时性的要求都很高。由于企业运行高度数据化,因此所有生产系统和生产管理都高度依赖数据中心,数据中心的故障将造成企业生产和管理的完全瘫痪,因此,对系统的故障时间和停机时间都有非常严格的要求。上面的数据层的RPO/RTO值反映了这个问题,同时对于系统的安装造成的停机时间也必须严格控制。
应用的测试
   从容灾中心的应用,必须能够进行定期的测试,以保证数据和系统的完整性和可用性,因此容灾中心的设计,应该能够充分满足以上要求,方便容灾中心测试工作的制度化和简易性。
业务的倒换和回切
   容灾中心必须支持业务的倒换(即所有业务流完全通过容灾中心的系统进行)和回切(在业务倒换完成后,原始数据中心能够支持业务工作了,再将业务刘从容灾中心切换回原始数据中心)。根据容灾中心的设计要求,能够支持在RTO值的时间内,进行业务的倒换。
Kashya解决方案
   根据用户工程具体的技术要求以及我们进行的需求分析,参照存储网络容灾系统的设计模式及原则,以采用先进成熟性技术手段为设计思路,充分发挥RecoverPoint产品技术优势,结合最新存储网络技术发展,我们设计了以IP技术为传输骨干,采用RecoverPoint新一代存储复制解决方案。
   经过上面的存储现状描述和需求分析,我们可以在下面的篇幅中进行详细的容灾复制方案的设计,并且给出配置的设备的详细描述。
   如图二所示,Kashya的解决方案由四个RecoverPoint的机箱构成,每两台分别在主数据中心和容灾数据中心形成双服务器集群的高可用性解决方案。RecoverPoint通过光纤通道(FC)接口和千兆以太网接口,分别连接到SAN网络设备和LAN网络设备上面,从而,位于主节点这边的RecoverPoint在接收到主机的写磁盘命令后,经过处理,然后通过IP方式进行,透过广域网将数据传送到异地的从节点的RecoverPoint设备处,形成历史快照,再写入到磁盘系统中,保持与主节点的数据一致性。

 


 


图三 RecoverPoint方案容灾数据中心拓扑
用户容灾数据中心SAN网络拓扑

   如上图四,我们在容灾数据中心的结构和主数据中心采用了对称的拓扑。
   我们还可以将磁带备份工作转移到了容灾中心去,通过利用RecoverPoint特殊的TSP功能,使数据的备份工作,可以在完全不需要停止主数据中心向容灾数据中心复制的情况下进行备份。
   RecoverPoint存储复制方案分析
  RecoverPoint采用了独创的领先技术,是一个先进的企业级灾难恢复解决方案。该方案应用于当前用户网络具有以下特点:
    支持异构磁盘子系统之间的数据复制
    利用IP网络进行数据复制
    支持超长距离的数据复制
    支持基于策略的数据复制
    能够恢复到任意时间点
    支持双向的数据复制
    支持灵活的容灾数据中心的检查和批处理
    长距离的“同步”解决方案
    通过综合的手段,降低总体拥有成本
   通用的数据保护
   RecoverPoint是一个端对端的数据复制解决方案,支持异构的存储和服务器环境,为整个企业提供完整的数据保护。主、从节点之间的存储系统没有必要相同,可以采用相对低廉的磁盘阵列或充分利用现有存储设备,以便降低费用,保障现有投资。本方案中我们在主数据中心和容灾数据中心采用的是相同HP EVA 3000磁盘阵列,其实容灾中心还可以配置不同的磁盘阵列,降低了磁盘阵列的总体造价。用户可以根据成本要求选择其它品牌或者档次的磁盘阵列。
   确保数据的一致性
  RecoverPoint保证在任何可能的故障或灾难中对企业数据进行一致性的复制。当前的许多产品无法确保数据在“多次同步”或“重复性灾难”发生的情况下保持数据的一致性。RecoverPoint可以确保在任何时间,甚至在异构存储和服务器的环境下仍然保持数据一致性。我们的技术可以同时保证关键业务系统等的所有系统数据在进行恢复时,全部拥有完美的数据一致性和完整性。
   智能带宽应用
   RecoverPoint采用了智慧型的“带宽约减”技术,使得系统对带宽的需求达到了空前降低。这就可以在现有的网络带宽环境下提供最高程度的数据复制,这一点最大幅度地降低了对WAN需求的成本并大大缩短相同数据量情况下的传输时间,尤其是基于远距离的数据复制。
   通过storage-aware和application-aware算法技术,可以达到高效的数据压缩能力,从而降低对传输带宽的需求,这一点是传统的数据压缩技术所无法比拟的。
   策略化的数据复制
   RecoverPoint提供了全面的数据复制机制,从同步、异步以及时间点。复制过程按照用户的策略自动管理,并动态调整复制过程,按照可用带宽、每个应用的工作量来为每个应用达到一定的数据复制要求,从而在复杂或异构环境中极大地简化了数据和灾难恢复的管理难度。
   比如,针对数据保护要求比较苛刻的应用如关键业务系统,我们可以为其定义一种“最小延迟”的复制策略。这样,系统会利用所有可用的带宽资源来实现主从节点之间数据复制。另外,我们也可以为非生产系统定制“最小带宽”的复制策略,使得系统利用尽可能少的带宽资源,实现生产数据和相对非关键数据的不同策略处理。
   如果还没有决定如何选择所需要的带宽,在对系统实施阶段的评估,RecoverPoint专家小组将帮助用户建立起一个完整的策略,并提供广域网带宽租用建议。
   远距离的同步保护
  RecoverPoint提供了数据的同步保护级别,对应用性能无影响,距离无限,同时对存储设备无需额外的花费。
   该特有功能解决了当前方案对距离限制的问题,并实现了对区域性灾难的完整的实时数据保护,同时不会降低应用性能。
   系统将根据用户的网络延时、带宽使用情况,自动调节系统的同步保护级别,而不是象EMC SRDF方案一样,强制用户选择同步、半同步或异步方案,一旦选定,无法更改。
   双向的数据复制能力
   KBX5000提供了双向的数据复制能力,因此能够使主数据中心和容灾中心互为保护。例如,大型公司在不同的地方拥有分公司,各分公司都具有数据中心,都有应用数据需要保护,此时,可以互相将自己的数据复制到对方的数据中心,而共同使用同一套容灾基础设施和软件。
   任一时间点的恢复
   RecoverPoint维护着一个始终可用的快照历史库,该快照历史可以方便地完成基于某一个时间点的数据回滚,提供快速的数据恢复。RecoverPoint提供了基于远程节点多个事务一致性快照的支持,允许可靠地恢复数据库应用环境。
   通常,“快照”(数秒钟一次)可以在数据崩溃的情况下有效地减少数据丢失。
   容灾节点的数据处理
   RecoverPoint支持从节点数据的直接读取和写入操作,而无需预先从主节点产生拷贝。系统支持故障切换和数据回滚的能力,降低管理和操作成本。
   我们将数据备份系统移到容灾中心,就是充分利用了该功能。
   始终可用和无限扩展性
   RecoverPoint支持高可用集群技术,是Active-Active模式的独立体系,这样可以保持系统始终可用,并可以无限扩展。
   我们的方案允许用户的应用服务器进一步增加,而不需要对系统做任何增加更改,简单配置就可以完成扩充。
   整体成本优势
   RecoverPoint提供了强大的数据保护功能,但是在整体成本上远远低于当前方案。同时,异构存储的支持、带宽的降低、软件、结构及操作维护等等都为用户提供了更为节约的解决之道。
   便于管理
   RecoverPoint支持NDMP管理协议,便于在其他应用或再开发中加以集成。同时RecoverPoint具有丰富的故障报告机制,图形化的界面使得管理更加便利。
   RecoverPoint的管理界面设计简洁明了,用户可以方便、轻松地通过它对容灾系统进行配置、复制、监测、恢复、批处理等工作。

 


图四 RecoverPoint的GUI管理界面

  RecoverPoint解决方案的竞争优势
   本次项目构建的RecoverPoint灾难复制系统的优点总结如下:
   (1)采用智能带宽节约技术实现意想不到的带宽费用节约,最高可达15倍(TPCC 测试试验室数据,常规可达6-10倍,并可以针对特定数据库系统智能感应优化);
   (2)适合任意存储的数据复制解决方案,可以充分利用现有存储或采用低端磁盘阵列,进一步大大降低费用;
   (3)支持恢复到任一个时间点,而不需另外产生数据的拷贝,并降低因此而节约的存储空间,并提供对现有在线业务系统进行不中断业务的容灾复制测试的灵活性;
   (4)任意距离的数据实时复制,十分方便将来新增或转移灾难备份系统扩展的实现;
   (5)策略化的应用数据复制解决方案,实现具有QoS智能的灾难备份;
   (6)支持异构存储和服务器平台,极大程度地利用了用户原有的投资,避免浪费;
   (7)提供支持双向数据复制;
   (8)利用标准的IP网络,无需专线或协议转换;
   (9)全球广泛的行业应用合作伙伴及大量商用系统实例已经验证了其卓越的性能,比如包括从以色列到美国如此遥远长途跨大洋几万公里的灾难备份系统的成功实施。
阅读(796) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~