Chinaunix首页 | 论坛 | 博客
  • 博客访问: 11490895
  • 博文数量: 8065
  • 博客积分: 10002
  • 博客等级: 中将
  • 技术积分: 96708
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-16 17:06
文章分类

全部博文(8065)

文章存档

2008年(8065)

分类: 服务器与存储

2008-07-17 11:44:05

 如果原来做过数据备份的,或者做过IT管理的,都了解数据对于企业系统的重要性,数据保护实际上跟数据可用性有关系的,数据保护也有很多种,比如说数据备份就是其中的一种,还有数据复制,还有一些其它的方式。今天主要还是讲的内容是数据备份。

    数据保护平时都在做,但只有在数据真正丢失的时候才能体现数据备份的重要性,我们把这个定位成R,当你发现问题,你要判断问题,判断好问题以后才能采取方法来恢复丢失的数据,这是第二个过程。第三个过程叫Restoration,主要是指丢失的数据,这个数据原来做过备份,把这个数据从你备份的地方恢复到现有磁盘上。比如说从此地倒回磁盘这个过程叫Restoration。Recovery是指,从磁带倒到磁盘上只是把备份的文件导到磁盘上了,但是其中的一些日志和数据的表还需要逻辑上的恢复,我们把这个恢复上的数据倒成能用的数据叫做Recovery。所以整个数据的恢复过程就是这个DDRR。

    为什么要讲这个DDRR呢,因为我们在数据保护里面经常看到两个概念:RPO、RTO,这两个的定义比较长,后面有两个图给大家看一下(PPT)。所谓RPO就是恢复点目标,RTO是恢复时间目标。恢复点目标是指你在上一次做数据保护的时间点就是恢复点目标。恢复时间目标就是从你数据丢失到开始恢复,最后到系统能够重新运行,把数据完全恢复出来,这段时间叫做恢复时间目标。我们看下这张图就可以理解了,比如说最开始做了PIT,在这个时间点上做了一次备份,随着时间的过去系统在不能运行的时候需要采取一些恢复措施,从发生问题到想到解决问题,这其中有一个判断的过程,比如说判断是哪里坏了。然后才是Restoration的过程,我们把一开始做备份的时间到出现灾难这段时间所花费的恢复时间就是Recovery  time。

    在一开始做备份的地方到出现灾难这段时间就是你损失的数据量,所以说在定义恢复点的时候如果能够越接近数据中断的时间,目标在这段损失的时间越短你需要做的就越少。RPO就定义了你允许你能损失多少数据。RTO就是指出现问题一直到恢复系统所花的时间。所以这两个是做系统备份、保护所需要考虑的最主要目标。

    不同的备份手段能达到的RPO、RTO效果是不一样的,最简单的备份就是软备份,也叫一线备份,就是说系统正在运行有些数据没法做备份,这时需要停下来,系统需要重新启动,这个备份叫做冷备份。除了这个还有热备份。另外还有第三种能在任何时间做备份,不会造成任何数据的丢失。

    RPO、RTO这两个是做系统备份考虑的最重要的两个因素,另外还有备份窗口Backup Window,在做备份的时候系统会受到影响你就会想到在空闲时间做备份,这个备份窗口与RPO、RTO是考虑的三个最重要的东西。

    另外还需要考虑能投入多少钱,允许花多长时间恢复这些数据。所以早期投钱越多、采用的方法越好,将来损失的数据也是越少的,最简便的。

  主要讲的内容是备份,备份是数据保护的一种方法,除了备份之外还有一种方法叫镜像,有两方式:同步和异步。基本上没有Restoration和Recovery这两个过程,恢复起来就等于是直接能用的,RPO和RTO这两个是非常好的,但做镜像的造价比较高,需要准备两套磁盘系统做复制。

    刚才讲了备份和做镜像,还有RPO和RTO等基本改天。再讲一下现在有哪些备份网络或者备份结构。我们看一下这个图(PPT),其中有几个概念,我们一个一个来看,上面绿颜色这部分是备份,另外的是应用服务器,备份服务器做备份的管理工作。实际上应用服务器才是我们要保护的对象,通常是在上面装一个备份软件,备份服务器本身会带一个二级设备,可以是磁盘也可以是磁带。备份系统是由备份软件和备份服务器来控制,它管理所有的备份工作,有管理备份软件的设备。做这些备份的工作,比如说什么时间做的备份,数据存在哪了,用磁带库做的备份,哪个数据存在哪个磁带上,上面都有所记录,就如同它的一样。另外还有备份带,主要作用是传送给备份服务器上,然后再传给备份设备。

    不同备份软件叫的名词不一样,有些软件既有管理服务器,又有连接设备的服务器,有的叫备份节点或者存储节点。我们刚才讲了备份数据保存的地方,可以是磁盘也可以是磁带。

    我们刚才看了再一个备份系统中的基本概念,讲到了备份服务器、备份代理,磁带放在什么位置,下面来看一下它们之间的网络构架有哪几种。第一是传统的局域网备份,在这个局域网里面被保护的机器,它的数据由备份代理输进来以后通过服务器、网络传给备份服务器,备份服务器就会把这个备份的数据存到二级存储设备或者磁带库上面。同时备份服务器也会更新它的日志,这个日志也是很重要的,有的地方管它叫元数据,也就是保存的位置,也就是Meta-Data。这种方式使大量的数据都通过网络来存储,所以当你的数据量非常大的时候,网络带宽占有的情况就很高了,你的数据如果太多的话就要考虑是不是用千兆以太网,或者用专门跑备份的网络。

    当然网络有一个问题,普通的局域网里面传输的速度永远达不到现速,1000M比特,你的速度永远达不到1000M比特。所以如果你的数据量非常非常多,在规定的时间内备份不完,这个时候我们要考虑另外一种备份方式,叫做LNA-free,这是存储网络工业协会做的,包括应用服务器的存储、备份服务器的存储(二级存储或者磁带库)都连接在网络里,可以通过光纤通过服务器再通过光纤网络传到设备上。

    刚才漏了一个幻灯片,本地备份,分为你用的数据存储和磁带存储都是连到同一台机器上的,这是最传统的一种方式,其实最早的备份都是这样做的,比如说7、8年前,或者2000年以前大家都采用这样的备份方式。比如说在有的系统里头,有的单位有电子邮件服务器、数据库服务器和WEB服务器,就三个备份服务器,都是自己备份自己的。

    到2001、2002、2003年采用网络备份的方式是最多的,从2003年开始采用局域网备份的方式越来越多,因为这个构架已经有了,大家都开始采用这种方式。除了这三种,这三种应该是最常见的,但是备份系统有的地方叫用设备的备份,有的是不用设备的备份也就是Server-free。不论在哪里备份的时候都要在这台机器上装一个备份代理,然后再转给相应的设备,这个备份代理都要占用系统的资源,所以有的系统都要求24小时连续运行,又不希望在备份的时候被干扰,所以有一种技术就叫Server-free,就是在做备份的时候不用服务器。平时我把主要的数据做一个镜像,然后在做备份的时候把它断掉,只给它做备份,然后这台机器联到另外一台服务器上,这样对应用服务器一点影响也没有,不会占用它的CPU,所以这是Server-free其中一种的备份方式,但是目前这个方式很少有人用,因为这个备份系统造价是很高的,说白了就是你要配两套系统,平时一部分给别人提供工作使用,另外一部分是做备份时候用的,所以造价是很高的。另外的原因是备份软件还要买相应的应用协议。

    刚才讲的这一种Server-free的备份用的非常少,还有一种Server-free,它俩的区别在于什么呢?刚才的那种方式是再找一台服务器,代替原来的应用服务器,由它来搬移数据,那你的设备本身,如果你的磁带库能搬数据的话就使用这台服务器,Data Mover也相当于数据库一样,也可以处理数据。

    现在最好最理想的备份方式就是从磁盘直接从磁盘上搬东西,就是不通过任何服务器了,这种原理应该说是具备的,但基本上还是没有人用这种方式的。刚才讲了备份的构架,有几种,一种是传统的本地备份、LAN备份、LAN-free备份、Server-free备份,还有全备份、增量备份,全备份是把所有的数据都做一遍;增量备份就是选择某一时间段做某些数据的备份,根据应用数据的变化过程来做数据备份的过程叫增量备份,这样做的好处是做全备份的时间会比较长,做增量备份的时候可以由选择性。

    所以有些软件为了解决恢复要恢复好多次的问题,提出了一个概念叫做合成备份,意思就是一开始也做一个全备份,但是也做增量备份,在后台把这些增量备份合成,恢复只需要一次就可以了,所以比全备份恢复的速度要快。

    备份的基本概念就讲的差不多了,下面来看一下磁带与磁盘:任何的数据要把磁带卷到相应的位置才能读取,磁盘就会相对容易一些,是随机的。但是磁带本身的速度并不慢,比如说现在用一个RTO3的服务器,一秒钟能传80M数据,但是在随机读取的时候性能就很差了。单盘的磁带呢,一盘现在是400G,但现在的数据量越来越大,可能一盘备份不完,可能要用多盘磁带,磁带要用放在磁带服务器上读,所以这个工作要用人来做的话也是比较慢的,所以现在就有一种设备叫做磁带库,磁带库里面有一个自动的机械手能够把磁带抓出来放在驱动器里面,所以你的备份软件是自动化的,可以定时做任务,备份设备也是自动化的,所以这样就可以形成一个无人值守的系统。

    我们看磁带库的工作是怎么做的,左边是应用服务器,右边是备份服务器,备份服务器通过光纤连接磁带库,然后数据由备份代理收集来之后通过局域网或者通过其它的途径传到磁带库。

    用磁带库有什么好处、有什么坏处。好处就是它的成本比较低,现在所有的存储设备,磁带、磁盘、光盘。磁盘是最贵的,磁带是最便宜的,所以最好的好处就是价格便宜。备份已经发展很多年了,有很多成熟的标准软件、成熟的磁带库,所以整个备份的技术非常成熟。另外磁带还有一个好处就是能够一盘盘的拿到其他的地方,很方便,有些单位数据保护要求比较高,可能就把磁带运到另外一个地方。比如摩托罗拉公司,每天把北京备份的磁带运送到天津的摩托罗拉,然后天津的备份磁带运送到北京这边。

    不好的地方就是它的性能,连续读取的性能还是很不错的,但是随机读取的好性能就要差些。另外它的可靠性,通常来讲磁带驱动器读取磁带,时间长了之后寿命会减少,所以它的可靠性也是一个问题。磁带存在速度、可靠性和成本的问题,成本虽然购置成本比较低,但是一损失会损失价值比较高的数据,所以损失就会比较多一些。

    如果采用磁盘,现在磁盘越来越便宜,所以现在有越来越多的人来考虑磁带有它的坏处,考虑能不能采用磁盘备份的方式,也有选择两者都用的。磁盘主要的好处就是刚才讲磁带不太好的地方,它的速度比较快,因为它是随机读写的,可能要挑一些数据恢复,随机读一些数据,在这种情况下的恢复速度是很快的。另外磁盘阵列本身连接的设备相对比较少的,就是一个控制器,对于磁带库来讲里面有机械壁设备,还有好几个驱动器设备,所以这设备共享这块比较有好处。但是原来备份都是按照磁带库来做的,没有人按磁盘做,所以现在用磁盘来做就比较累,你要管理磁盘,所以最近几年大家开始把磁盘给打扮成磁带库,就是让它看起来像磁带库,装一个磁带库的模拟软件,看起来像磁带库但应用起来却是磁盘,所以虚拟磁带库的方式就是这样做的,从介质方面来看就是磁盘好一些。所以把两者结合起来,以你的恢复时间目标、恢复时间点的目标,以你的综合情况来考虑。

建成备份系统或正在建这个系统,你可能要考虑备份系统扩展问题。我们先看一下在备份里面牵扯到哪些元素,一个是,可能我在我的备份里面又有、又有。另外是磁盘和网络构架以及备份设备。所以我们在做扩展的时候要考虑异构的问题,能支持多种操作系统、支持多种的品牌磁带库,另外你的构架怎么样,另外你的标准是不是通用标准。还有设备管理,实际上备份系统里面最关键的东西是备份软件,备份软件的能力决定了将来在扩展的时候要考虑的备份设备,构架是依赖于备份软件的。最后就是安全,原来大家考虑数据安全、网络安全,最近两年欧洲、美国开始考虑备份系统安全,数据备份到磁带上,磁带的安全程度怎么样,也是需要考虑的一个地方。另外能不能做集中管理、安装是否简单。

阅读(1171) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~