猝然临之而不惊,无故加之而不怒。
分类:
2007-06-12 09:53:00
网络系统容错分析与NOVELLⅡ级镜像容错实施
任永金
摘 要:从计算机网络系统的硬、软件两个侧面进行了容错分析,介绍了Novell的容错技术,给出了NOVELLⅡ级镜像容错的具体实施.
关键词:计算机网络; 容错分析; 容错技术; 镜像; 实施
分类号:TP393.1 文献标识码:A
文章编号:1007-9912(2000)02-0035-04
Fault-tolerance Analysis of Computer Net-wark and a Realization of Novell Ⅱ-class Mirror Image
REN Yong-jin
(Department of Mathematics and Computer Science,
Guizhou Normal University, Guiyang Guizhou 550001, China)
Abstract:Computer fault-tolerance is analysed from its softwares and hardwares and introduced the Nevoll fault-tolerance techniques. Especially, a concrete realization of Novell Ⅱ-class mirror image fault-tolerance is given.
Key words:computer network; fault-tolerace analysis; fault-tolerance technigue; mirror image; realization
随着计算机网络应用的日益普及与推广,不但网络系统越连越大,而且许多单位正在新建网络或扩大已有的网络系统.而网络系统的容错性能对计算机网络的正常运转极为重要.因此网络容错越来越受到不少学者和专家们的广泛关注[1~3].本文从网络系统的硬、软件两个侧面进行了容错分析,且介绍了NOVELL容错技术,并给出了NOVELLⅡ级镜像容错方案的具体实施.
1 硬件容错分析
硬件容错根据其在网络系统中的位置可分为服务器端、网络连接端和工作站端三个方面:
1.1 服务器系统的容错
网络系统的中心部份是服务器,服务器的性能直接影响着整个系统数据的完整性和可恢复性,因此服务器的容错性能是网络容错的关键问题.目前也有四种容错方案:
1)单台服务器.普通微机服务器的内部结构几乎没有容错考虑,而专用服务器则通过特殊设计,并采用冗余智能卡、冗余处理器功能模块、ECC(纠错码) 内存、磁盘阵列和ECC保护主机总线等措施,以改善其容错性能.如Netframe服务器在各个层次上提供部件冗余,包括中心系统处理器、共享内存、 MIPSA总线、I/O通道、网络接口、磁盘阵列、电源和冷却系统等.在内部结构上提供大型机所采用的数据检测电路,支持在服务器的各个数据传输通道上的错误自动检测及瞬时恢复;硬盘及应用处理板具备热插拔能力,出现故障可在线随时替换等.
2)RAID技术.RAID(Redundant Array of Inexpensive Disk)廉价磁盘冗余阵列,其功能有二:一是将数块小容量硬盘合成一块逻辑大硬盘;二是采用冗余数据方式,使得单个硬盘出故障时不会影响到正常的数据访问.
3)双服务器.要求两台服务器的型号配置一样.备用服务器的内存和磁盘的内容同步主服务器,平时处于待命状态,一旦主服务器发生故障,备用服务器便立即自动接替其工作.
4)群体技术.群集(clustering)即是将若干台服务器组成一个巨型的服务系统,以共同实
现网络数据控制.其中每台服务器均有各自的任务,因而其工作效率与服务器的个数成正比.
1.2 网络连结端的容错
网络连接端的设备包括网卡、通信电缆、集线器、交换器和路由器等.其容错方法有二:一是挑选本身具有容错功能的设备;二是设计系统时采用备份设备,且二者均需考虑网络设备连接起来后的整体效果.
1)方案选择.目前常用的网络方案有Ethernet、Fast Ethernet、 1Gb Ethernet、FDDI和ATM等.不同的方案不但在其技术的先进性、可扩展性、成熟性及经费上不同,且其容错性能也有很大差异.例如:目前金融业使用的FDDI,它采用的是双环反向拓扑结构,其每个站点有一前向链与相邻的前一个站点连接,形成主环.后一向链与下一站点相连,形成次环,主次环反向旋转.当环路发生故障时,系统自动从故障处断开,在两端重新形成新的环路,从而提高了网络系统的整体容错性能.
2)设备选择与实施.目前使用的通信电缆主要有同轴电缆、双绞线和光纤.它们又分不同的型号和规格.其中双绞线因价廉物美而被用户亲睐.对于广域网 (WAN),因受传输距离远,路途因素复杂等影响,对其网络连接端设备的容错性能也就要求更高.对于局域网(LAN),一般已互相连接或通过广域网连接,并以公共电话线作备用,所以从经济与实用的角度来考虑,采用双绞线即可.
1.3 工作站容错
工作站容错相对服务器来说则要低得多,但也要注意两点:一是采用多个工作站配备一个备用工作站;二要选用元器件可靠性高的机器作工作站.
2 软件容错分析
软件容错的关键是选择网络操作系统,不同的网络操作系统对整个系统的硬软件容错具有极大影响.
2.1 网络操作系统的容错
网络系统中所有设备和资源,包括服务器、工作站、打印机、集线器、交换器、路由器、软件及数据等都由网络操作系统进行管理.随着不停机系统的普及,网络操作系统也增加了对网络设备与资源的管理;诸如UPS电源监护、热修复、写后读校验、磁盘双工、双机热备分、群集和事务跟踪等.
2.2 其它软件的容错
随着网络系统的越连越大,尤其是不停机系统的逐步增加,对软件的要求也就越来越高.如早期版本的Dbase和Foxbase没有容错功能,而Foxpro开始有所考虑,到最新发布的Visual Foxpro5.0也逐渐向大型数据库靠拢.Sybase和Oracle等大型数据库几乎都不支持自动热备份,但支持共享磁盘的群集技术以提高网络系统的容错性.其中Oracle能充分发挥群集优势,做到任务均衡.然而Sybase却做不到.
3 NOVELL容错技术分析
因NOVELL是目前最为广泛流行的局域网,故对其容错性能专门列出,乞今为止,Novell容错技术分为三个等级[1,4]:
3.1 SFT-1
SFT-1是最初级的磁盘容错,它主要是提供磁盘坏块的热定位(HOT FIX)和双重文件目录及文件分配表.当目录扇区出错时,服务器立即自动转向冗余扇区继续工作.该级技术是在服务器通电时由Netware自动提供.
3.2 SFT-2
SFT-2级容错分四种情况:1)磁盘镜像.磁盘镜像是由一块硬盘控制卡连接两块硬盘构成.两块硬盘是主/从关系,两硬盘有差异时,就将主盘上的数据拷贝到辅盘上.辅盘功能有二;一是做主盘的备份,二是检验主盘的数据,并当主盘失效时,自动充当服务器的主盘,使系统继续工作,从而实现容错目的.2)磁盘双工.磁盘双工与磁盘镜像容错性能一样,不同的只是磁盘双工是由两块硬盘控制卡连接两块硬盘构成.双工因采用两套控制器寻址,虽增加了费用,但更加提高了系统的保险性.3)RAID(廉价磁盘冗余阵列).RAID系统由多个并行磁盘驱动器组成,RAID将数据分段一次写入多个磁盘上,当磁盘发生故障时,存储在奇偶校验盘或分段存在多个驱动器上恢复数据的附加信息,将故障盘从阵列中移走,并插入正常磁盘继续工作,从而大大提高了网络系统的容错性能.4) TTS(Transaction Tracking System)事务跟踪系统,它是对关联性数据的一种保护方法.如果数据处理过程中突然断电或死机,则数据保护不完整,TTS在下次启动时将处理前的数据全部写入,以确保数据的完整性.
3.3 SFT-3
SFT-3是对整个服务器进行镜像,其系统包括一台主服务器和一台备份服务器.对于网络上的每一个工作站,只有主服务器在起作用,备份服务器的内存及磁盘与主服务器保持定时备份,一旦主服务器或其中的配件出现故障,备份服务器自动切换为主服务器.所以在SFT-3中,当任一服务器失效后,整个网络仍能正常运行.
4 NOVELLⅡ级镜像容错的具体实施
SFT-3虽可极大地提高系统容错性能,但其费用的增加也是明显的,SFT-2中的硬盘双工采用双通道技术,可提高磁盘I/O处理能力,但比镜像在资源分配和硬盘连接费用上有所增加.因此对于一般中小型企业的用户而言,硬盘镜像不失为一种既能增加容错性能,又不致增加较多费用的最佳方案.现将其具体构造实施方法介绍如下[5]:
4.1 准备工作
1)选购一只与Novell网络服务器中硬盘类型完全一致的硬盘;
2)打开机壳,将新硬盘安装到硬盘基座上,接上电源线并将硬盘控制卡上连接电缆的第二个插头插入新加入硬盘驱动器的插座上,关好机壳.
4.2 操作步骤
1)启动机器,并进入Netware操作系统;
2)键入:LOAD INSTALL;
3)在“Installtion options”菜单中选择“Disk Options”;
4)在“Available Disk Options”菜单中选择“partition Tables”;并在“Available Disk Options”中选择“Device#1(20001)ISA TYP 006”;
5)在“Partition Options”中选择“Creat Netware Partition”;输入与Device#0分区中数据区域块数相同的数值,并按〈ESC〉键两次,退回到“Available Disk Options”菜单;
6)在“Available Disk Options”菜单中,选择“Mirroring”,屏幕显示如下菜单:
Partition Mirroring Status
Not Mirrored:logical Partition #1
Out of Sync:logical partition #2
7)从“Partition Mirroring Status”清单中,选择要镜像化的分区:logical partition#1后回车,屏幕显示“Mirrored Netware Partitions”清单,当前镜像化到选定分区的硬盘出现在清单中:
8)按〈INSERT〉键,从“Available Partition”清单中选择硬盘:Netware 386 Partition 2 on Device#1(20001),当镜像化过程完成后,两个硬盘即为’Insync”(同步);
9)按〈ESC〉键,返回并退出INSTALL.
至此,SFT-3镜像已完成.在实施过程中必须注意两点:一是两硬盘参数完全一致;二是从盘分区必须与主盘分区相同或相近.否则,从盘将处于“out of sync”状态.另外,SFT-2级容错虽可增加Novell的容错性能,但对于重要数据和文件资料仍需要用软盘或其它设备备份,以确保万无一失.
5 结束语
要使网络系统具有良好的容错性能,涉及的因素很多,所以在建网或扩大网络系统时,一定要综合考虑各种因素对网络容错性能的影响,尽可能寻找和实施容错性能最好的方案.对于广大中小型企业和高校学生机房,从经济与实用考虑,采用 Novell网络二级镜像容错,不失为一种最佳选择方案.
作者简介:任永金(1956-),男,实验师.
作者单位:任永金(贵州师范大学 数学与计算机科学系,贵州 贵阳 550001)
参考文献:
[1] 王慧强,付 旋,陈 诗.一个并行容错局域网的设计与实现研究[J].计算机研究与发展,1997,34(10):777-782.
[2] 陈建明.容错技术及其在网络系统中的运用[J].计算机世界,1995(12):50-60.
[3] 王江伟.容错方案纵横谈[J].微计算机世界,1997(11):33-38.
[4] 褚建立,米永进.浅析Novell服务器的安全措施[J].微型机与应用,1998(11):33-35.
[5] 任永金.Novell网络维护经验浅谈[J].计算机时代,1999(8):27-28.
收稿日期:1999-11-04