分类: 服务器与存储
2008-06-06 05:28:36
按备份后的数据是否可更改可分为活备份与死备份。
活备份是指备份到可擦写存储介质,以便更新和修改。死备份是指备份到不可擦写的存储介质,以防错误删除和别人有意篡改。
按选择的备份软件的功能可分为动态备份与静态备份。
动态备份利用软件功能定时自动备份指定文件,或文件内容产生变化后随时自动备份。静态备份是指为保持文件原貌而进行人工备份。
为了实现自动化的备份、文件归档、数据分级存储以及灾难恢复等,需要使用网络数据存储管理系统。通过数据存储管理软件,结合相应的硬件和存储设备,对分布式网络环境下的数据备份进行集中管理。
网络数据存储管理系统配有专用的备份服务器,备份服务器需要安装网络数据存储管理服务器端软件,连接一台大容量存储设备(磁带库、光盘库)。需要进行数据备份管理的服务器需要安装备份客户端软件,通过局域网将数据集中备份到与备份服务器连接的存储设备上。
网络数据存储管理系统的核心是备份管理软件,通过备份软件的计划功能,可建立一个完善的备份计划及策略,并可借助备份时的呼叫功能,让所有的服务器备份都能在同一时间进行。备份软件也提供灾难恢复手段,实现网络数据备份的全自动智能化管理。目前在数据存储领域可以完成网络数据备份管理的软件产品主要有Legato NetWorker、IBM ADSM、Veritas NetBackup等。
为了有效地进行备份,应列出一份紧要系统的列表,然后对每一个系统可能遇到的风险和威胁进行分析,根据这些重要的服务器制定备份方式和策略。一旦确认了重要系统,应明确以下问题:
系统是否有备份?
备份间隔是可接受的吗?
系统是按规定进行备份的吗?
是否确认备份介质正确的保存了数据?
备份介质是否在室内得到了正确的保护?
是否在另一处还有操作系统和存储设施的备份?(包括必要的license key)
存储过程是否被测试及确认?
备份的目的是保障网络系统的顺利运行,在网络出现故障甚至损坏时,能够迅速地恢复。灾难恢复在整个安全保障体系中占有重要的地位。灾难恢复操作通常分为两类系统恢复、个别文件恢复。
系统恢复:在服务器发生意外灾难导致数据全部丢失、系统崩溃或是有计划的系统升级、系统重组等,需要系统恢复。
个别文件恢复:个别文件恢复可能要比全盘恢复常见得多,利用网络备份系统的恢复功能,我们很容易恢复受损的个别文件。只需浏览备份数据库或目录,找到该文件,触动恢复功能,软件将自动驱动存储设备,加载相应的存储媒体,然后恢复指定文件。
将备份的文件恢复到另一个不同的位置或系统上去,而不是进行备份操作时它们当时所在的位置我们称为重定向恢复。重定向恢复可以是整个系统恢复也可以是个别文件恢复。重定向恢复时需要慎重考虑,要确保系统或文件恢复后的可用性。
完整的备份方案,还需要做好详细的灾难恢复计划,定期进行灾难演练。灾难演习,可以利用淘汰的机器或多余的硬盘进行灾难模拟,以熟练灾难恢复的操作过程,并检验所生成的灾难恢复软盘和灾难恢复备份是否可靠。
(3)双机容错系统
双机容错系统的一个CPU板出现故障时,其他CPU板保持继续运行,这个过程对用户是透明的,系统没有受到丝毫影响,更不会引起交易的丢失,充分保证数据的一致性和完整性。系统的容错结构能够提供系统连续运行的能力,任何单点故障不会引起系统停机,系统提供在线的维护诊断工具可在应用继续运转的情况下修复单点故障。系统通过冗余的服务处理器统一监控系统所有设备的状态,监控服务器自身出现故障的概率可以认为是0。系统运行及处理过程中,冗余的部件都在使用,处于“热”状态中,可以加快交易的处理,增加带宽,提高系统处理的速度和效率。
(4)双机热备份
双机热备份是当CPU出现故障时由闲置状态的备份系统接替,但正在处理的交易有可能丢失,从而导致数据的不一致。双机热备份系统关键部件如CPU的故障将导致主系统停止运行,对应用产生很大的影响。当发生系统故障引起停机后,恢复运行时应用需要从磁盘或磁带上重新启动,需要耗费更多的宝贵时间。双机热备份采用“心跳线”保持主系统与备用系统的联系,一旦“心跳线”部分发生故障,系统很难分清是“心跳线”还是系统其他部分的故障,往往需要人工干预才能解决问题,应用也将受到影响。双机热备份备用系统的硬件和软件资源处于闲置的冷状态,浪费系统资源。
(5)三机表决系统
在三机表决系统中,三台主机同时运行,由表决器根据三台机器的运行结果进行表决,有两个以上的机器运行结果相同,则认定该结果为正确。现在三机系统中较多采用的是将双机备份和三机表决两者结合起来的方式,当三机中坏掉一台后就当作双机备份系统来用。
(6)集群系统
均衡负载的双机或多机系统就是集群系统(Clusting)。DEC公司最早在其VAX系统上实现了集群技术,多服务器集群系统的主要目的是使用户的应用获得更高的速度、更好的平衡和通信能力,而不仅仅是数据可靠性很好的备份系统。
图为一个计算机群集管理系统。三台服务器通过以太网相联,并通过SCSI电缆分别接到磁盘阵列柜上,磁盘阵列柜作为三台服务器的共享数据存储设备。在三台服务器上,分别安装了NT及Lifekeeper容错软件包。三台服务器分别作三个应用,其中服务器A用作Sybase,服务器B用作Lotus Notes,服务器C用作Internet服务,这三个应用都安装在LEC-380 8型磁盘阵列柜上。正常工作时,三台服务器分别作各自的应用,并通过网链及SCSI链相互侦测工作状态。当有一台服务器发生故障时,另两台服务器中工作量较少的一台服务器自动接管发生故障的服务器的数据、用户及应用进程。故障服务器恢复正常后,自动恢复到初始的正常状态。