分类: 服务器与存储
2008-06-22 16:48:32
容灾,不仅是技术课题,更是观念上的革新
1995年1月,日本神户地区大地震,摧毁了1700余部电脑系统,造成1千多亿美元的损失。
……
研究显示,在灾害之后,如果无法在14天内恢复信息作业,有75%的公司业务会完全停顿,43%的公司再也无法重新开业,有20%的企业在两年之内被迫宣告破产。
备份:保数据安全
数据容灾的目的是保证数据的安全可靠,其实现途径就是备份。简单来说,备份就是将数据复制到独立于工作磁盘的存储介质上,从而有效地防止磁盘崩溃带来的毁灭性打击。
1.离线备份与在线备份
离线备份要求备份期间服务器停止应用程序、中断对外服务,这也是备份的原始形式。但在今天,企业对计算机的依赖日益增长,例如信用卡之类的事务处理需要24小时不间断运转,留给备份的时间也就所剩无几,因此,离线备份对于长时间提供服务的应用来说是不可取的。
快照技术将时间引入了数据存储,用户在使用当前数据的同时,也可以看到以前某个时间点的数据,并能通过它很方便地实现在线备份。
快照过程分为创建期和存在期。在快照创建时,要冻结原逻辑分区的所有读写操作,保证分区中数据的一致性,使快照得到冻结时刻系统的即时备份。快照创建后,用户即可使用快照数据,当有写命令对某一数据块进行操作时,快照程序就将原数据块的内容复制到快照数据区域,然后再将新的数据写入原物理位置。可以看出,快照所提供的在线备份实际上是将离线备份所需要的时间划分成很小的时间间隔,然后均匀分布到每一次写操作中。
2.完全备份与增量备份
顾名思义,完全备份需要对所有文件进行备份,无论这些文件自上一次备份后是否被修改过,而增量备份只备份在上一次备份后被修改过的文件。
增量备份是比较为人称道的方式。因为在两次备份间被修改过的文件相对于整个备份文件集合来说只是少数。当备份周期是一天或者更短时,通常只有少于1%的文件被修改。此时,增量备份只复制完全备份1%的数据,占用1%的存储资源。增量备份分为差别备份和累积备份:差别备份是从上次备份后修改过的文件的拷贝;累积备份是指自上一个完全备份后被修改的全部文件拷贝。
完全备份、累积备份和差别备份可以通过互相组合以平衡备份对应用的影响以及整个文件系统和的恢复时间。例如,一周的备份工作可以这样设计:周日生成完全备份;周一、周二和周三生成差别备份;周四生成累积备份;周五和周六生成差别备份。当需要恢复一周的数据时,首先恢复上周日的完全备份,再恢复周四的累积备份,最后恢复周五和周六的备份。在这个过程中,恢复数据至多需要四次恢复。
3.LAN-Free备份与Serverless备份
目前,企业IT系统大部分是客户机/服务器结构,与该结构对应的是分布式备份管理。在这种结构中,备份服务器的数据通过企业LAN传输,这有违企业LAN用于应用程序通信的初衷,同时,这种方式也会造成备份数据路径冗长,存储区域网络(SAN)的引入有效地缓解了这些问题。
LAN-Free备份把大部分数据从LAN中分离出来并通过SAN传输,于是备份不会影响其他用户的日常工作。然而LAN-Free备份并没有缩短数据从磁盘到磁带的传输路径:备份数据从磁盘经由SAN转移到备份服务器的存储器,再一次经由SAN转移到磁带驱动器缓冲区,最后写入磁带。
如果磁盘和磁带都连接到SAN,那么就有可能不经过服务器缓冲区直接在它们之间传输数据,这通常称为无服务器(Serverless)备份。服务器可以命令读取指定范围的数据块并直接送到指定的磁带驱动器,如此一来,数据就直接从磁盘流向磁带缓冲区,从而减少了50%的数据传输量,节省了时间和I/O资源。
两种应用容灾途径
1.数据镜像
数据镜像就是保留两个或两个以上在线数据的拷贝。以两个镜像磁盘为例,所有写操作在两个独立的磁盘上同时进行;当两个磁盘都正常工作时,数据可以从任一磁盘读取;如果一个磁盘失效,则数据还可以从另外的一个正常工作的磁盘读出。这些数据中心如同孪生兄弟,齐心协力为您的正常业务保驾护航。
远程镜像根据采用的写不同可划分为两种方式:同步镜像和异步镜像。同步镜像是指“写”操作会同时在原始磁盘和镜像磁盘上完成;异步镜像虽然同时将“写”命令和数据同时发送给原始磁盘和镜像磁盘,但原始磁盘的“写”操作完成后并不需要等待镜像磁盘完成“写”操作,后者的“写”操作可以通过数据复制进程异步完成。
一般来说,镜像是在硬件架构的基础上由软件实现的,通常可在系统的三个位置上实现:
● 卷管理器
● 磁盘控制器
磁盘控制器除了完成数据块的移动、拷贝、计算等特殊功能外,还带有功能强大的通用处理器,磁盘控制器是一些较大型服务器实现数据镜像和RAID最为常用的位置。
● 主机总线适配器
2.集群技术
首先,进入系统的客户请求是由一组协作的路由器接收,它们使用负载平衡技术在许多应用程序服务器之间分发请求的。这些路由器的主要功能是把到来的请求平均地分发出去,因此这种技术能够承受路由器的失效:一旦有路由器失效,其他路由器可以重新分发请求或负载。
最后,共享数据的访问是由服务器层次中的第三层,即一个或文件服务器的集群提供。不同的文件服务器和
在复杂的集群系统中,能容错、可扩展的RAID子系统通常是必要的。诸如磁盘和路径失效的承受能力、镜像的写回高速缓存以及控制器失效转移这些存储子系统的典型特点证明了“存储集群”这个名字是恰当的。当集群存储使用SAN连接时,集群是最为灵活也最容易管理的,这是因为SAN在所有存储设备和服务器之间提供了完全直接的连接。通过连接集群中所有服务器和所有存储设备,SAN提高了灵活性,使并行服务集群可以扩展到更多的应用程序,也使应用程序失效转移能够在服务器间连续进行,从而具有更高的可用性。