Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1278782
  • 博文数量: 1211
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 14340
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-09 11:20
文章分类

全部博文(1211)

文章存档

2011年(1)

2008年(1210)

我的朋友

分类: 服务器与存储

2008-06-12 22:30:45

 
备份可测问题
网络备份存在着一些很明显的挑战,当计划备份时,必须考虑以下几个关键因素:
 
              备份窗口。
              最大的备份资源。
              更新的数据量。
              网络传输率。
              备份设备的速度。
              备份引擎的性能。下面各小节将对这些问题分别进行讨论。
 
1. 备份窗口
 
备份窗口是在白天或晚上完成备份所需要的时间。通常认为备份窗口只对冷备份有用,但事实上它也可以应用于热备份,其原因在于既可以在服务器运行时对其备份,也可以在服务器关闭时对其进行备份。备份的性能影响也限制了备份的运行时间。
 
基本上,可以考虑两个备份窗口。一个是夜间备份,即介于正常上班时间之间的整夜备份。这是一个典型的三至八小时的备份窗口,主要用作增量或差量备份操作。另一个备份窗口是完成一周或周期性完全备份,这个备份窗口可以延长到2 4小时,有时,甚至从周五傍晚持续到周日后半夜。在这两个窗口所限制的范围内,备份系统都应该能够工作。
 
本章前面已经讨论了两种热备份技术,即写前拷贝和快照技术,其目的是缓解2 4×7计算的问题,使在这种情况下仍然保持备份窗口的大小。
 
2. 最大的备份源
 
网络备份通常包括了绝大部分网络的备份要求。遗憾的是,当备份网络中的最大备份源时,它常常显得力不从心。在这种情况下,备份源是指源系统上的存储成分之一,该源系统唯一地由备份系统管理。例如,逻辑磁盘卷或数据库系统都可以是备份对象。一种常见的情况是,一个特别的备份对象比其他的备份对象大得多,而且它所包含的数据很重要,必须通过备份来保护。不幸的是,网络备份系统没有足够快的速度完成这个作业。在这种情况下,唯一的方案有时只有将专用备份系统直接安装到这个系统上,而该系统必须配有高速磁带驱动器。有时,可能需要虚拟磁带子系统,这里将磁盘驱动器作为磁带设备使用。
 
3.     总数据量
 
数据量本身并不是一个难于理解的概念,总数据量对于确定完全备份的变化很重要,当制订恢复需求计划时,它也很重要。注意这并不是存储总量,而是存放在存储设备中的数据总量。
 
4.     更新的数据量
 
确定每天需要备份的更新数据量是很困难的,但可以通过文件系统扫描或搜寻操作进行粗略地估计,从这天的某个任意时间到另外某个任意停止时间中,拥有新的日期和时间的所有文件。比如说,从上午6 : 0 0到下午6 : 0 0。当前的备份记录也可以给出更好的每天实际的备份负荷。更新数据量的目的是确定需要多少并行备份进程,才能满足工作日的增量或差量备份操作。
 
5.     网络传输速度
 
前面已经陈述,网络备份能够使网络达到饱和状态,导致严重的性能下降。当估算备份对网络的影响时,需要考虑几个因素。然而,如果小心地考虑和计划,可以做出现实的估计。在大部分情况下,每天的备份是主要问题,因为工作日的备份窗口时间短,这就限制了备份操作的运行时间。在周末通常有更多的时间完成备份,这使系统管理员的压力也减小了。
 
在网络上应该运行并行的备份操作,但究竟需要多少并行备份呢?我们可以使用一些快速的方法来确定。首先,对于一个1 0 0 B a s e T的网段,合理的估计速度可以达到1 . 5 M B / s,假如将1 0 0 M b i t网络等价于1 0 M b y t e链,这个估计是现实的,因此,单个的1 . 5 M B备份会话仅使用了网络总的可用带宽的1 5 %。
 
既然我们正在考虑日备份,我们首先使用更新数据的平均量,那么,假如估计网络的传输速度为1 . 5 M B / s,那么,可以计算所需要的会话数,即用数据量除以备份窗口和传输速度的积:
 
更新数据/ {(备份窗口)×1.5MB/s} =所需并行会话数
 
当做这些计算时,必须将通常的使用单位转换成其他单位。例如,以每秒计算的传输速度必须与以小时或分钟计算的备份窗口一致。
 
举一个例子,考虑一个网络备份情况,假设网络服务器上的数据改变量是1 2 G B,备份窗口是1个小时,使用上面的方程和统一的单位,实际的计算如下:
 
12000MB / {60min ×(9 0 M B / m i n)} = 2.2 次会话
 
从网络的观点看,并不存在非整数会话,所以这种情况下并发的传输数量应该是3,由于每个会话的传输速度为1 . 5 M B / s,那么3个会话就意味着网络传输量为4 . 5 M B / s。但是,对于1 0 0 M b 的以太网来说,这是很难实现的。虽然在理论上,可以使用两个网段共同承担这个负载,但在备份引擎上可能需要三个独立的1 0 0 M b端口,以支持三个独立连接上的这个传输负载。
 
6.     磁带设备速度
 
尽管网络是备份传输瓶颈的可能性最大,但它也未必是唯一的一个。大部分网络传输较平均的磁带驱动器速度慢得多,但是,由于提供给磁带的数据源很多,如交叉的数据、专用的本地备份、远程的设备操作,所以,这些数据的速度也可能超过磁带的性能。
 
假如提供的数据足够快,磁带驱动器能够保持流式速度。正常情况下,磁带设备制造商都发布磁带驱动器的持续吞吐量规范,其数据压缩率可以按2 : 1计算。例如,8 m m的螺旋扫描驱动器所给出的传输速度是6 M B / s,那么,它的非压缩传输速度就是3 M B / s。相比其他I / O技术而言,持续传输速度与数据的可压缩性关系更密切。
 
为了及时而成功地结束备份,软件的设备并行性也是一个很重要的因素。
 
7.     备份引擎的性能
 
对于网络备份来说,备份引擎的性能对数据由网络I / O传输到存储I / O也起着重要作用,它控制着一个系统,该系统带有如P C I总线的主机I / O总线,以及高速的适配器,为了节省备份引擎中的插槽数,可以考虑使用多端口的N I C。
 
正像曾经讨论的那样,数据库处理对备份的需求具有挑战性,因此,备份引擎的处理能力和内存越大越好。
阅读(323) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~