Chinaunix首页 | 论坛 | 博客
  • 博客访问: 242952
  • 博文数量: 199
  • 博客积分: 7010
  • 博客等级: 少将
  • 技术积分: 2860
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-22 00:12
文章分类

全部博文(199)

文章存档

2011年(1)

2008年(198)

我的朋友

分类: 服务器与存储

2008-07-22 00:34:47

近年来,电子商务、企业信息化的高速发展,对计算机系统的安全性也提出了更高的要求。一些著名的C2C交易平台一个小时的交易量就已上千万。在这样高的负荷下,一旦突发事件导致数据破坏,如果迟迟不能恢复,其后果将不堪设想。

    可见,在这样的大型系统中,数据的备份与即时恢复显得尤为重要,这些有效的措施保证了当某些小概率事件发生时,整个系统的安全恢复和正常运行。

    在持续性数据保护(Continuous Data Protection)出现之前,传统的备份技术一直在追寻着更加快速,更加高效的备份与恢复性能。持续性数据保护技术的出现则为用户这种无止境的追寻和需求提供了一个新的窗口。它以一种全新的思路,突破了传统备份不可逾越的性能瓶颈,颠覆了整个容灾恢复领域。下面让我们来系统地阐述持续性数据保护与传统备份之间差别。

传统的备份的局限性
    数据备份是将数据以某种方式加以保留,以便在系统遭受破坏或其他特定情况下,重新加以利用。一般备份一般都会把备份数据保存在另一台设备上,这样一旦工作的存储设备发生意外,可以从备份设备中把数据及时恢复到原有设备上。

    企业的数据库一般较为庞大,对于大型的数据库,耗时有可能是数十分钟,也有可能数个小时,所以我们很难做到数据的即时备份。折中的办法是选择在数据访问量最小的时刻(通常是在晚上)进行一次系统地备份,可以对全部数据进行一次备份,也可以仅仅把修改过的数据进行备份(差异备份)。一般企业都会为此而拟定专门的备份策略。

    这样就带来一个问题,如果灾难发生在白天,则恢复数据时,只能恢复到上一次的备份点(Restorable Point),因为在此之后到灾难发生,并没有任何对数据保护的记录,这段时间的数据将永远丢失。

    由此也产生了一个企业系统容灾与恢复的概念——数据恢复点目标(RPO):即应用中可以容忍的在灾难发生前数据丢失的时间段长度。一般要求每隔这个时间段,就要对数据做一次备份。数据恢复点目标决定于应用的数据访问频率。数据访问频率越大,就要求数据恢复点越密。

    另外一个与此对应的指标是恢复时间目标(RTO)。它定义了灾难发生后,多少时间之内可以从数据备份中恢复。传统的数据备份因为备份的是这个数据集。所以恢复起来需要相当的时间。这一段时间内,潜在的访问量将被拒绝。对于某些公司而言,也是一笔巨大的损失。

    对于某些企业较高的RPO和RTO性能要求,传统备份方式很难达到。尽管备份的软件厂商一直都在试图缩短备份的时间窗口和恢复时间,但一直没有找到合适的解决办法。

CDP带来的数据容灾恢复技术革命
    CDP,持续性数据保护(Continuous Data Protection),它的出现解决了容灾恢复领域的这个难题。CDP并不像快照,需要每隔一定的时间对数据进行定期的备份。它在每一次对数据集进行写操作的同时,就将数据修改以日志(Log)的形式记载下来,并同时记载上修改数据的时间戳。记下了整个数据集变动的时序。

    由于CDP将大量数据的集中备份分解为每一次修改数据时的日志记录,所以单次数据保护所花费的时间是可以容忍的。

    CDP日志可以做到以字节、以块或者以文件为单位进行记录。也就是说,如果我们修改了一个大小为100GB的文件中的一个字节,CDP只需记录这个被修改的字节,而传统的数据备份可能需要备份这整个文件。这样大大地降低了数据备份所需要的时间。这也是CDP优于传统数据备份的原因之一。

    CDP技术是一种精细化多点跟踪技术,这一种精细化体现在,它可以基于文件,也可以基于BLOG,但是总的机制是基于IO跟踪技术的,他们是实时备份。跟传统的备份差异比较大。他的恢复不是通过数据的技术来完成的,它是通过CDP设备的立即使用的方式,能够将所备份的数据立即提供出来,因此它的恢复能力是相当强的。一般来讲,在几分钟内可以完成极大数据量的恢复。

    目前CDP的技术通常分为两种类型:一种叫主机型的CDP技术。是通过一个外置CDP设备,也是一个CDP保护中心,实时的抓取系统主机内各种变量数据,它需要在主机上安装一定的代理ARGENT,通过这样的代理,可以把基于主机IO级别的变化实时的影射到中心里面,也就是说一个增量中心,通过这样增量中心实现一个独立的数据的保存。这一种设备是独立主机之外的,通过抓取实现增量跟踪。

    还有一类技术是存储网络型,这种形式的CDP技术,通过把CDP设备接入到存储网络里面,推动捕捉每一个存储网络上的磁盘的变化,实时的捕捉到同一网络当中另外一个CDP设备。这样的方式跟系统在存储网络这一层次有一些结合。

未来备份的方向

很显然,由于日志里记录了任何时刻对数据的任何修改的信息,所以CDP可以做到了任意时间的恢复点目标(RPO)。

同时,由于CDP是以修改日志的形式进行数据保护的,所以在灾难恢复时,一般也是依据数据修改时记录的日志,用向前或者向后滚动的方法恢复数据。而由于CDP将备份的颗粒度减小到字节或块,所以恢复所需的时间比传统备份的恢复时间要少,可以满足更高的RTO要求。

现在市场上出现了很多准CDP解决方案。它们的原理还是基于快照等技术,只是通过技术的改进,是恢复点之间的时间间隔缩小,恢复时需要的时间缩短而已。有些能成功地缩短到一小时备份一次的RPO和几十分钟内恢复的RTO。但是它们不能算是真正意义上的CDP解决方案。对于小于一小时的RPO就无能为力了。真正的CDP解决方案是可以做到粒度无限的恢复点(RPO),因为它有效地记录了数据集的整个时序。

对于那些数据量不大的企业或者应用没有必要用CDP,普通的快照备份或者上述的准CDP解决方案就足以满足。而对于那些数据量很大,而且都是关键数据,并且要求RPO小于一小时或者RTO需要小于一分钟的关键应用,企业需要考虑应用CDP解决方案。然而从长远来看,CDP是一个趋势。集成了存储空间小,任意时间点恢复,恢复用时短这三个优点的CDP,没有理由被用户拒绝。

阅读(383) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~