Chinaunix首页 | 论坛 | 博客
  • 博客访问: 714448
  • 博文数量: 535
  • 博客积分: 9970
  • 博客等级: 中将
  • 技术积分: 7260
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-15 03:47
文章分类

全部博文(535)

文章存档

2011年(1)

2008年(534)

我的朋友

分类: 服务器与存储

2008-06-22 16:48:32

容灾,不仅是技术课题,更是观念上的革新

 

容灾分为数据容灾和应用容灾。数据容灾可以保证数据不丢失,但不能保证服务不中断;应用容灾则更上一层楼,它在异地建立一套与本地数据系统相当的冗余系统,当灾难出现后,远程系统可以迅速承接本地应用系统的业务,保证服务不中断。在实际应用中,数据容灾依靠备份技术实现;应用容灾则必须依靠远程镜像技术和技术。

在容灾得以广泛发展的背后,是一片片令人心痛的惨象:

1993年,世贸中心大楼发生爆炸。爆炸前,约有350家企业在该楼中工作,一年后,回到世贸大楼的公司变成了150家,有200家企业由于无法恢复重要的信息系统而倒闭、消失。

1995年1月,日本神户地区大地震,摧毁了1700余部电脑系统,造成1千多亿美元的损失。

1999年6月,美国一家著名的商业交易网站的主机宕机,由于24小时内未能恢复访问,两个星期后,该公司的股票市值下跌了36%。

……

研究显示,在灾害之后,如果无法在14天内恢复信息作业,有75%的公司业务会完全停顿,43%的公司再也无法重新开业,有20%的企业在两年之内被迫宣告破产。

或许以上案例颇有危言耸听之嫌,毕竟山崩地裂大火熊熊的场面不常出现在我们的视野里。但造成损失的不止是这些恐怖性的灾害,生活总是充满偶然:失手按错键或错点鼠标,或者失手打翻一杯水泼溅到笔记本电脑上,都可能给我们带来大麻烦。因此,对容灾来说,“亡羊补牢,犹未晚也”的观点显然已经过时,“防患于未然”才是我们必须做到的。

备份:保数据安全

数据容灾的目的是保证数据的安全可靠,其实现途径就是备份。简单来说,备份就是将数据复制到独立于工作磁盘的存储介质上,从而有效地防止磁盘崩溃带来的毁灭性打击。

 

1.离线备份与在线备份

离线备份要求备份期间服务器停止应用程序、中断对外服务,这也是备份的原始形式。但在今天,企业对计算机的依赖日益增长,例如信用卡之类的事务处理需要24小时不间断运转,留给备份的时间也就所剩无几,因此,离线备份对于长时间提供服务的应用来说是不可取的。

快照技术将时间引入了数据存储,用户在使用当前数据的同时,也可以看到以前某个时间点的数据,并能通过它很方便地实现在线备份。

快照过程分为创建期和存在期。在快照创建时,要冻结原逻辑分区的所有读写操作,保证分区中数据的一致性,使快照得到冻结时刻系统的即时备份。快照创建后,用户即可使用快照数据,当有写命令对某一数据块进行操作时,快照程序就将原数据块的内容复制到快照数据区域,然后再将新的数据写入原物理位置。可以看出,快照所提供的在线备份实际上是将离线备份所需要的时间划分成很小的时间间隔,然后均匀分布到每一次写操作中。

2.完全备份与增量备份

顾名思义,完全备份需要对所有文件进行备份,无论这些文件自上一次备份后是否被修改过,而增量备份只备份在上一次备份后被修改过的文件。

增量备份是比较为人称道的方式。因为在两次备份间被修改过的文件相对于整个备份文件集合来说只是少数。当备份周期是一天或者更短时,通常只有少于1%的文件被修改。此时,增量备份只复制完全备份1%的数据,占用1%的存储资源。增量备份分为差别备份和累积备份:差别备份是从上次备份后修改过的文件的拷贝;累积备份是指自上一个完全备份后被修改的全部文件拷贝。

完全备份、累积备份和差别备份可以通过互相组合以平衡备份对应用的影响以及整个文件系统和的恢复时间。例如,一周的备份工作可以这样设计:周日生成完全备份;周一、周二和周三生成差别备份;周四生成累积备份;周五和周六生成差别备份。当需要恢复一周的数据时,首先恢复上周日的完全备份,再恢复周四的累积备份,最后恢复周五和周六的备份。在这个过程中,恢复数据至多需要四次恢复。

3.LAN-Free备份与Serverless备份

目前,企业IT系统大部分是客户机/服务器结构,与该结构对应的是分布式备份管理。在这种结构中,备份服务器的数据通过企业LAN传输,这有违企业LAN用于应用程序通信的初衷,同时,这种方式也会造成备份数据路径冗长,存储区域网络(SAN)的引入有效地缓解了这些问题。

LAN-Free备份把大部分数据从LAN中分离出来并通过SAN传输,于是备份不会影响其他用户的日常工作。然而LAN-Free备份并没有缩短数据从磁盘到磁带的传输路径:备份数据从磁盘经由SAN转移到备份服务器的存储器,再一次经由SAN转移到磁带驱动器缓冲区,最后写入磁带。

如果磁盘和磁带都连接到SAN,那么就有可能不经过服务器缓冲区直接在它们之间传输数据,这通常称为无服务器(Serverless)备份。服务器可以命令读取指定范围的数据块并直接送到指定的磁带驱动器,如此一来,数据就直接从磁盘流向磁带缓冲区,从而减少了50%的数据传输量,节省了时间和I/O资源。

两种应用容灾途径

应用容灾的目标是保证服务不间断,最常用的两种方法是数据镜像和技术。

1.数据镜像

 

数据镜像就是保留两个或两个以上在线数据的拷贝。以两个镜像磁盘为例,所有写操作在两个独立的磁盘上同时进行;当两个磁盘都正常工作时,数据可以从任一磁盘读取;如果一个磁盘失效,则数据还可以从另外的一个正常工作的磁盘读出。这些数据中心如同孪生兄弟,齐心协力为您的正常业务保驾护航。

远程镜像根据采用的写不同可划分为两种方式:同步镜像和异步镜像。同步镜像是指“写”操作会同时在原始磁盘和镜像磁盘上完成;异步镜像虽然同时将“写”命令和数据同时发送给原始磁盘和镜像磁盘,但原始磁盘的“写”操作完成后并不需要等待镜像磁盘完成“写”操作,后者的“写”操作可以通过数据复制进程异步完成。

一般来说,镜像是在硬件架构的基础上由软件实现的,通常可在系统的三个位置上实现:

● 卷管理器

作为服务器的软件组件,它是在文件系统和主机总线适配器驱动程序之间构架的单独一层,其主要目的是把服务器挂载的物理磁盘驱动器虚拟化,以更方便的形式提供给文件系统使用。

● 磁盘控制器

磁盘控制器除了完成数据块的移动、拷贝、计算等特殊功能外,还带有功能强大的通用处理器,磁盘控制器是一些较大型服务器实现数据镜像和RAID最为常用的位置。

● 主机总线适配器

一些供应商开发了一种既可以提供传统主机总线适配器的功能,又能实现多I/O总线接口以及RAID和数据镜像算法的主机总线适配器。这种主机总线适配器具有很高的性价比,已经普遍应用在小型部门服务器上,但由于这种主机总线适配器难以实现多主机的数据存取,所以它们在企业服务器上的用途有限。

2.集群技术

企业对数据处理的高可用性和可扩展性要求促进了集群技术的发展,因为集群能够达到容错和扩展的目的。复杂集群可以在以下三个层次上保护数据和应用:

首先,进入系统的客户请求是由一组协作的路由器接收,它们使用负载平衡技术在许多应用程序服务器之间分发请求的。这些路由器的主要功能是把到来的请求平均地分发出去,因此这种技术能够承受路由器的失效:一旦有路由器失效,其他路由器可以重新分发请求或负载。

其次,网络路由器在应用程序服务器集群间分发客户请求,这些服务器访问一组公共数据。这一技术允许应用程序承载超越单个服务器能力所及的负载,如果一个应用程序服务器失效,它就停止响应网络路由器的请求,网络路由器在剩下的应用程序服务器中重新分发工作负载。

最后,共享数据的访问是由服务器层次中的第三层,即一个或文件服务器的集群提供。不同的文件服务器和器使用不同的机制互相合作,其效果是使运行在这个层次的服务器上的数据管理实例能够互相合作,从而形成一个可处理数据访问请求的集群,以保证数据的一致性。

在复杂的集群系统中,能容错、可扩展的RAID子系统通常是必要的。诸如磁盘和路径失效的承受能力、镜像的写回高速缓存以及控制器失效转移这些存储子系统的典型特点证明了“存储集群”这个名字是恰当的。当集群存储使用SAN连接时,集群是最为灵活也最容易管理的,这是因为SAN在所有存储设备和服务器之间提供了完全直接的连接。通过连接集群中所有服务器和所有存储设备,SAN提高了灵活性,使并行服务集群可以扩展到更多的应用程序,也使应用程序失效转移能够在服务器间连续进行,从而具有更高的可用性。

阅读(337) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~