分类: 服务器与存储
2012-02-10 15:01:57
在上一篇文章中主要讲解的是,我曾经对后期重复数据删除技术的一些误解,如果有和我一样的朋友希望你们在读完我的文章后可以消除一些误解,来重新看待重复数据删除这项技术,总体而说这项技术现在还是很不成熟,但是我觉得通过不断改进可以使他变得的成熟,毕竟这项技术对于我们还是很有帮助的,减少无效的数据,提高存储设备的使用效率,节省企业的不必要开支,后面我继续写一些关于重复数据删除技术的误解。
降低了备份数据流读取速度是否不利于数据备份。
从技术上说,在同等条件下采取重复删除技术,肯定会在一定程度上降低备份数据流的读取速度。后来我明白了一点,评价一个技术是否合适,并不能够只看一个指标,而应该从总体上去评价。简单的说,需要评价一下总体的备份时间是否有所缩短?复杂一点,需要判断备份过程是否能够满足备份窗口,或者RTO的需求?在实际工作中,有些指标可能比备份数据流的读取速度更加的重要。如RTO需求就是如此。
另外还有一点,如果采取重复数据删除技术的话,一般要求相关设备要有比较高的配置或者性能。因为从数据备份的任务来看,其实包括两个部分,分别为数据的传统备份与重复数据删除作业。虽然说这两个作业可以独立运行,但是其运行所需要的时间是不同的。而只有当重复数据删除处理结束之后,整个备份作业才算真正完成。故如果后期处理重复数据删除设备的性能比较差时,就会降低系统的重复数据删除比。所以在部署这个项目的时候,往往会对重复数据删除设备进行评估与测试,看其性能上是否能够满足要求。
在我曾经的工作中有很多案例可以说明,虽然采用重复数据删除技术后会在一定程度上降低存储数据流的读取速度,但是却可缩短整个备份作业所花的时间,能够满足RTO的需求。有句俗话说的好,只看结果不看过程。评价任何一门技术都是如此,应该从一个整体上进行评价,而不能够某几个个别的指标。否则的话,就可能会引起用户的误判。
重复数据删除技术与备份数据流写入作业真的是无法同时完成吗
曾经我一直认为重复数据删除技术与备份数据流写入作业无法同时完成,但是后来我才知道如果备份数据流在写入的时候,只对同一个磁盘进行操作,那么这个问题确实存在。但是在现实工作中,这是根本不存在的。因为在实际应用中,重复数据删除技术往往是跟虚拟存储等结合使用的。也就是说,一般会将备份数据流写入到多盘虚拟磁带介质中。而实际写入磁带的数量往往会远远大于实际拥有的磁带驱动总数。这说明一个什么问题呢?也就是说,当其他磁带正在进行复制或者读写等操作的时候,重复删除技术可以在其他磁带介质上进行重复数据删除的作业。换句话说,就是重复数据删除作业与数据复制、写入等到作可以并发的运行。只是其操作的对象不同而已。两者可以互不冲突的独立运行。
我现在担心的是如果数据读写作业要对某个磁带驱动器进行操作,而这个虚拟磁带库正好在进行重复数据删除作业,此时这个作业就会停下来。从而产生冲突。可是凭现在的技术还很难从根本上解决这个问题,只可以曲线救国。如将虚拟磁带库的容量设置的小一点,让这个冲突产生的几率降低。
另外据我了解,已经有厂商在往这方面努力。如他们尝试着通过分割磁带数据区域的方法来实现并发读写。如果这个技术能够实现的话,那么当备份软件正在对某个磁带介质进行写入操作的时候,就可以对这个介质的其他部分进行重复数据删除处理。这个原理很简单,就是将某个磁带数据区域再进行划分,以实现不同区域的并发处理。
总之,还是那句话:技术不成熟有待改进,但是现阶段我们还是可以使用的,只要是设置好规则,这项技术还是对我们的帮助还是很大的。