1.1 双机备份方案描述
现代IT技术认为,一个成功系统中数据及作业的重要性已远超过硬件设备本身,在一套完善的系统中对数据的安全及保障有着极高的要求。双机容错系统是由IBM公司提出的全套集群解决方案,结合IBM服务器产品的安全可靠性和集群技术的优点,为用户提供一个完善的系统。
1.1.1 双机备份方案的原理
两台服务器通过磁盘阵列或纯模式,连接成为互为备份的双机系统,当主服务器停机后,备份服务器能继续工作,防止用户的工作被中断。
1.1.2 双机备份方案的适用范围
用户对系统的连续工作性和实时性要求较高,系统停机对系统的影响很大,造成很大的损失。
1.1.3 双机备份的方式及优缺点
磁盘阵列备份方式—— 两台服务器通过磁盘阵列连接起来,形成备份系统,此方法硬件投资
大,价格较贵,但系统易于安装,也相对稳定。
磁盘阵列备份模式示意图
1.2双机备份方案
由IBM系列产品组成硬盘备份模式
主机:采用IBM X255
主机网卡:采用IBM 10/100/1000MM网卡
磁盘阵列:采用EXP300 磁盘阵列, 配制RAID 5
具体实现方法参见后面章节附图和说明
IBM X255结合EXP300磁盘阵列的双机方案
系统简述:
整个系统由两台IBM高端服务器X255和EXP 300磁盘阵列构成双机备份模式,双台服务器互为备份,当一台服务器出现问题停机时,另一台服务器能实时接管中断的工作,保证业务系统的正常运行。
EXP 300磁盘柜磁盘具有热插拔功能,具可以灵活组成RAID模式,当一块硬盘损坏,数据可以恢复,保证数据不丢失。
1 .3 IBM PC 服务器双机容错系统解决方案
由于采用了双机容错的集群结构,系统具有极高的可靠性。两台服务器可以作为一个整体对网络提供服务,且相互间互为监控。集群具有一定的负载平衡功能,可将一个任务的多个进程分摊到两台服务上运行,提高系统的整体性能。当一台服务器发生故障时,其上所运行的进程及服务可以自动地由另一台服务器接管,保证网络用户的工作不受影响。同时,如果系统采用RAID技术对数据进行保护,可确保重 要数据不因系统故障而造成损失。
特点:
高可靠性
支持冗余磁盘阵列
冗余电源和风扇设计
所有部件均支持热插拔
主机可各自运行自己的应用,互为备份,共享磁盘数据
高性能单块IBM ServeRAID卡数据传输带宽可达 160MB/s
数据传输I/O可达3000次/s
主机与磁盘间的距离可达20米
高可用性
可扩展性强/性能价格比高/高容错性,系统安全高效
产品介绍(略,有兴趣的朋友可以去IBM网站看看详细的介绍)
2.1 磁盘阵列备份模式介绍
概述
在双机热备的架构中,除了要考虑切换时间外,要根据每个系统的作业环境,包括网路系统是单网或是双网,数据库的安装和作业内容及用户端的设备是经由广域网路、区域网路接入不同用户有不同的需求,而要求有不同的切换模式,所以选择不同的切换模式,可以使用户端的改变达到最少的程度。EDI-HA根据不同的行业及各行业不同的需求设计多种备援模式以弹性的调适用户的最佳组合及选择。
模式---双机双网络适配器(DualEthernetAdopter)
• 双主机各自通过一条SCSI电缆线与RAID相联
• 双主机各自运行不同的作业
• 每一主机定义第一网口和第二网口
• 主机A上等一网0在故障时由第二网口接管
• 主机B上等一网0在故障时由第二网口接管
• 主机A故障后,主机B自动接管主机A的作业和数据
• 主机B同时接管A的主机名(Host)及网络地址(IP)
• 主机A的作业将在主机B上自动运行
• 主机A的客户(client)可继续运行,无需重新登录
• 主机A同样可作B的备份机
• 可进行数机双工备份和网卡的备份
软件配置
在方案中,我们采用美国ROSE公司的NT Cluster软件,作为双机热备份软件;采用台湾DFT磁盘阵列作为双机系统公用数据的存储设备。其构成如图1所示。如果其中一台服务器由于硬件或软件原因(最近国际调查显示70%的服务器故障来自软件错误)发生故障失效,另外 一台服务器可在保证提供自己原有服务的同时,启动失效服务器的应用程序、文件系统、IP地址和打印机等网络资源服务从而取代其服务器功能。
美国Rose数据公司Rose HA for NT双机热备软件。Windows NT平台下的双机热备份软件,广泛用于金融、电信、政府等部门的核心业务。备受业界推崇的优秀产品。
Rose HA产品经过了许多大型项目的考验,诸如福建、重庆等地的邮电97,外经贸部、宝钢等等,是一套成熟、稳定、可靠的产品。
目前Rose NT Cluster及其OEM产品占有中国市场NT平台HA软件的大部分市场份额。
通过GUI,可以实时地观测到系统的状态,进行failover、take Over等操作。
美国Rose公司在中国设有办事处,对广大的中国用户提供强有力的技术支持
双机备份安装完毕之后配置群集服务
群集服务指南
在运行着Windows 2000 Advanced Server和Windows 2000 DataCenter Server操作系统的服务器上,安装群集服务的说明。该指南描述了在群集节点上,安装群集服务的过程。它的作用不是解释如何安装群集应用程序。而是指导如何安装典型的、两节点的群集本身。
内容:
介绍
群集服务安装的核对表
群集安装
安装群集服务软件
检验安装
附录:SCSI驱动器的安装
1. 介绍
群集服务器是一组独立的服务器,运行群集服务,并象单个系统一样运作。通过将运行着Windows 2000 Advanced Server或Windows 2000 DataCenter Server的服务器编组,可组成群集服务器,从而对资源和应用程序提供了高可靠性的、可扩展性和可管理性。
群集服务器的目的是,在出故障或断电的情况下,保证客户对应用程序和资源的访问。如果群集里的某服务器由于故障或维护的缘故,不可用,资源和应用程序将移到其它可用的群集节点上。
对于群集系统,常使用高可用性,而不是容错性,这是由于容错技术提供了高度的恢复能力。容错服务器通常使用高度的硬件冗余,加上特定的软件,对任意单个的硬件或软件故障,提供了近于即时的恢复功能。这些解决方案的成本大大高于群集解决方案。这是因为前者要提供多余的硬件,并处于空闲状态,等待故障的出现。容错服务器主要用于支持高品质、高速处理的场合,如票据交换所、自动柜员机(ATM)或股票交易。
群集服务不保证不停顿的操作,它为大多数执行关键任务应用程序提供了足够的可靠性。群集服务可监视应用程序和资源,并自动将多数故障状态识别和恢复出来。使用群集,可以为管理工作负荷提供更大的柔性,并提高整个系统的可用性。
群集服务的好处有:
高可用性:使用群集服务,资源的所有权,如磁盘驱动器和IP地址将自动地从有故障的服务器上,转到可用的服务器上。当群集中的系统或应用程序出现故障时,群集软件将在可用的服务器上,重启失效的应用程序,或将失效节点上的工作,分配到剩余的节点上。结果是,用户只是觉得服务暂时停顿了一下。
修复返回:当失效的服务器连回来时,群集服务将自动在群集中平衡负荷。
易管理性:可以使用群集管理器来管理群集,(如同在同一个群集中),并管理应用程序(就象它们运行在同一个服务器上)。可以通过拖放群集对象,在群集里的不同服务器移动应用程序。也可以通过同样的方式移动数据。可以通过这种方式来手工地平衡服务器负荷,卸载服务器,从而方便地进行维护。可以从网络的任意地方的节点和资源处,监视群集的状态。
可扩展性:群集服务可进行调整,以满足不断增长的需求。当群集的整体负荷超过群集的实际能力时,可以添加额外的节点。
针对在运行着Windows 2000 Advanced Server,和Windows 2000 DataCenter Server的服务器的情况,本文提供了安装群集服务的说明。该指南描述了在群集节点上,安装群集服务的过程。它的作用不是解释如何安装群集应用程序。而是指导如何安装典型的、两节点的群集本身。
2. 群集服务器安装核对表
该核对表帮助你做好安装的准备。在核对表之后是渐进指南。
软件要求
在群集里的所有计算机上,都安装了Microsoft Windows 2000 Advanced Server或Windows 2000 DataCenter Server。
有某种名称解析手段,如域名系统(DNS),Windows互连网命名系统(WINS),HOSTS,等。
建议安装允许进行远程的群集管理的终端服务器。
硬件要求
群集服务节点的硬件,必须满足Windows 2000 Advanced Server或Windows 2000 DataCenter Server的硬件要求。这些要求可在产品兼容性查找页面找到。
群集硬件必须是在群集服务硬件兼容性列表里的(HCL)。到Windows 硬件兼容性列表中,查询群集,就可以找到最新的群集服务HCL。
两台满足HCL的计算机,分别具有如下配置:
有所安装的Windows 2000 Advanced Server或Windows 2000 DataCenter Server的启动盘。该启动盘不能位于下面所描述的共享存储总线上。
共享的磁盘有独立的PCI存储适配器(SCSI或光纤)。启动盘适配器除外。
群集里的每台计算机有两块PCI网络适配器。
有HCL兼容的外部存储单元,它跟所有的计算机相连。它被作为群集磁盘使用。建议使用独立磁盘冗余阵列(RAID)。
用存储线缆,将共享设备连接到所有的计算机。可参考制造商的指南,配置存储设备。如果使用了SCSI总线,参见附录,查看额外的信息。
对于所有节点的所有硬件,每个插槽,每个卡,都应该是一样的。这将简化配置,消除潜在的兼容性问题。
网络要求
唯一的NetBIOS群集名。
五个独立的、静态的IP地址:两个用于内部网的网络适配器,两个用于外接公众网的网络适配器,一个用于群集本身。
一个群集服务的域名用户帐号(所有节点必须是同一个域的成员)。
每个节点应该有两个网络适配器,一个用于外接公众网,另一个用于点对点的群集内部网。如果只使用一块网络适配器完成这两种连接,这种配置是不被支持的。任何独立的内部网适配器都要求是HCL兼容的。
共享磁盘要求:
所有的共享磁盘,包括定额磁盘,都必须跟共享总线保持物理连接。
可以从所有的节点上,检查磁盘是否接到了共享总线上。可在主机适配器安装层次上,对此进行检测。请参考制造商的文档,了解具体适配器的用法。
必须对SCSI设备指定独立的SISC识别号,并按照相应的制造商的使用说明,完成相应的步骤。参见附录,了解关于安装和配置SCSI设备的信息。
将所有的共享磁盘都设置为基本(不是动态的)。
将所有的磁盘分区都格式化为NTFS。
建议对所有的磁盘,都使用容错的RAID配置(这不是强制要求)。这里的关键是容错RAID配置-不能是无奇偶校验的阵列集。
3. 安装群集
安装概要
在安装过程中,一些节点将要关机,而另一些节点将会重启。这些步骤是必要的,保证连接到共享总线上的磁盘里的数据,不会丢失或被破坏。这样,可以保证在某个磁盘没有被群集软件所保护时,不会同时有多个节点对它进行写操作。
使用下面的表一,确定每步应该对哪个节点或存储设备授权。
该指南中的步骤是针对两节点的群集的。然而,如果要安装超过两个节点的群集,使用节点2所在列里的信息,确定其它节点的必要的状态。
表 1. 群集安装的上电顺序
在安装群集服务软件前,必须采取一些步骤。这些步骤是:
在每个节点上安装Windows 2000 Advanced Server或Windows 2000 DataCenter Server。
设置网络。
设置磁盘。
在对首节点安装群集服务前,在每个群集节点上进行这些步骤。
为在基于Windows 2000的服务器上配置群集服务,你的帐号在每个节点上,都必须具有管理员权限。所有节点都必须是成员服务器,或者所有的节点是同一个域里的域控制器。在群集中,不允许一部分是域成员,一部分是域控制器。
安装Windows 2000操作系统
请参考Windows 2000操作系统包里附带的文档,在群集里的每个节点上安装操作系统。
该渐进指南使用了特定的命名结构,它源于"serversteps.asp"中的Windows 2000服务器的通用基础结构配置的渐进指南。当然,读者可以使用任意命名。
在安装群集服务之前,必须以管理员身份登录。
安装网络
注:在这一部分,要对所有共享存储设备断电,然后对所有节点上电。在至少有一个节点安装好群集服务,并保持在线之前,不要同时让多个节点同时访问共享存储设备。
每个群集节点都至少需要两个网络适配器-一个连接公众网,一个连接内部网(它只包含了群集节点)。
内部网适配器建立点对点的通信、群集状态信号和群集管理。每个节点的公众网适配器连接该群集到公众网上,并在此驻留客户。
检查所有的网络连接是否正确,看内部网适配器是否只跟内部网适配器建立连接,公众网适配器是否连接到公众网上。这些连接如下面图1所示。在执行共享文件安装前,在每个群集节点上执行这些步骤。
配置内部网络适配器
在群集里的首节点上执行这些步骤
右键单击我的网络位置,并单击属性。
右键单击本地连接2图标。
注:哪个网络适配器是内部的,哪个是外部的,取决于布线。在本文中,第一个网络适配器(局域连接)是连接到公众网上的,第二个连接(局域连接2)是连接到内部网上的。在你的网络中,可能不是这样。
单击状态。局域连接2状态窗口将显示该连接状态,以及连接速度。如果窗口显示网络连接断开,检查线缆和连接,在继续进行前,解决该问题。单击关闭。
右键单击局域连接2,单击属性,单击配置。
单击高级。将显示如下面图2所示窗口。
应该将内部网网络适配器的速度设置为网络的实际速度,而不是缺省选择的速度。从下拉列表中选择网络速度。不要使用速度的自动选择设置。一些适配器在确定网速时要掉包。为设定网络适配器的速度,单击适当的选项,如媒体类型或速度。
群集里的所有网络适配器都连接到同一个网上,应该具有同样的配置,使用同样的双工模式、流量控制、媒体类型等。即使硬件不同,这些设置也要保持一致。
注:我们强烈建议在整个群集网络里,使用同样的网络适配器。
单击传输控制协议/互连协议(TCP/IP)。
单击属性。单击使用下列IP地址单选按钮,并键入下列地址:10.1.1.1。(第二个节点使用10.1.1.2)。
键入子网掩码255.0.0.0。
单击高级单选按钮,并选择WINS标签。选择禁止通过TCP/IP使用NetBIOS。单击确定,返回上一个菜单。这个步骤只用于内部网的网络适配器。
窗口外观应该如下面图3所示。
配置公众网网络适配器
注:如果有DHCP服务器,那么,公众网的网络适配器的IP地址可自动获得,这不是群集节点的推荐使用方式。我们强烈建议,为群集节点里的所有的网络适配器配置静态的IP地址(对内部网和公众网的适配器都是如此)。如果IP地址时通过DHCP得到的,那么,如果DHCP服务器关机时,就无法访问群集节点。如果一定要对公众网适配器使用DHCP,就要使用长租期,保证即使DHCP暂时失效,动态分配的地址还会保持有效。在任何情况下,要为内部网络连接分配静态的IP地址。记住,对于一个子网,群集服务只能识别一个网络接口。
重命名局域网络图标
为明确起见,我们建议改变网络连接的名称。例如,可以将局域连接(2)改为内部群集连接。这个名称有助于区分网络,并正确地指定其角色。
1. 右键单击局域连接2图标
2. 单击重命名。
3. 在文本框中键入内部群集连接并按回车。
4. 重复1-3步,并将公众网适配器重命名为公众群集连接。
5. 重命名图标应该如上面图4所示。关闭网络和拨号连接窗口。当其它群集服务器在线时,该新连接名将自动复制到这些群集服务器上。
检查连接和名字解析
为检查内部网和公众网是否通信正常,对每个节点处的每个网络适配器执行下面的步骤。首先需要知道群集里的每个网络适配器的IP地址。如果不知道该信息,可使用在每个节点里的ipconfig命令,获取该信息。
1. 单击开始,单击运行,并在文本框中键入cmd。单击确定。
2. 键入ipconfig /all并按回车。将会在该机器上,显示所有的网络适配器的IP信息。
3. 如果在屏幕上没有命令行提示,那么,单击开始,单击运行,并在文本框中键入cmd。单击确定。
4. 键入ping ipaddress,这里的ipaddress时在其它节点里的相应的网络适配器的IP地址。例如,假设IP地址如下所示:
节点 网络名称 网络适配器IP地址
1 公众群集连接 172.16.12.12
1 内部群集连接 10.1.1.1
2 公众群集连接 172.16.12.14
2 内部群集连接 10.1.1.2
在这个例子里,需要并从节点1键入ping 172.16.12.14和 ping 10.1.1.2,并且在节点2键入ping 172.16.12.12和ping 10.1.1.1。
为检验名字解析,使用节点的机器名而不是IP号,从客户端ping每个节点。例如,为检验群集首节点的名字解析,可从任意客户端键入ping hq-res-dc01。
群集里的所有节点都必须是同一个域里的成员,并能够访问域控制器和DNS服务器。可以将它们配置为域控制器或成员服务器。如果决定将某节点配置为域控制器,那么,需要把同一个域里的其它所有节点也配置为域控制器。在本文档中,所有节点都配置为域控制器。
注:参看本文档后面的相关链接,链接到额外的Windows 2000文档,它将有助于理解和配置域控制器、DNS、DHCP。
1. 右键单击我的电脑,并单击属性。
2. 单击网络标识。系统属性对话框将显示完整的计算机名称和域。在我们的例子中,域名是reskit.com。
3. 如果使用成员服务器,并将它加入到一个域中。这时,可以这样做:单击属性,并按屏幕上显示的(关于如何加入到一个域中)说明去做。
4. 关闭系统属性和我的电脑窗口。
设置群集用户帐号
群集服务要求有域用户帐号,群集服务可以在在它下面运行。在安装群集服务前,必须先生成该用户帐号,这是由于安装需要用户名和口令。该用户帐号不应该属于该域里的用户。
1. 单击开始,指向程序,指向管理,并单击活动目录用户和计算机。
2. 单击+号,展开Reskit.com(如果此前它没有被展开的话)。
3. 单击用户。
4. 右键单击用户,指向新建,并单击用户。
5. 键入群集名称,如下面图5所示,并单击下一步。
6. 将口令设置设为,用户不能修改口令并且口令永远不过期。单击下一步,然后单击确定,创建该用户。
注:如果你的管理安全策略,不允许口令永远不过期。那么,在口令过期前,必须更改口令,并刷新组服务设置。
7. 右键单击活动目录用户和计算机插件的左边窗格里的群集。在上下文菜单中,选择属性。
8. 单击添加成员到群集。
9. 单击管理员并单击确定。这将使新用户在该计算机上,有管理员权限。
10. 关闭活动目录用户和计算机插件。
设置共享磁盘
警告:在其它节点启动操作系统前,要确保在一个节点上安装并运行了Windows 2000 Advanced Server或Windows 2000 DataCenter Server,以及群集服务。如果在至少有一个节点,安装、配置和运行了群集服务前,启动了其它节点上的操作系统,那么,群集磁盘将可能受到破坏。
为继续进行,对所有的节点断电。对共享存储设备上电,然后对节点一上电。
关于定额磁盘
定额磁盘是用来存储群集配置数据库的检测点和日志文件,以帮管理群集。对于定额磁盘,有如下建议:
创建一个小分区[至少有50兆用于定额磁盘。建议定额磁盘为500兆]。
将一独立的磁盘作为定额资源。由于定额磁盘的故障,将导致整个群集失效,强烈建议使用RAID磁盘阵列。
在群集服务安装过程中,必须为定额磁盘提供驱动器标号。在我们例子里,使用的是Q。
配置共享磁盘
1. 右键单击我的电脑,单击管理,并单击存储。
2. 双击磁盘管理。
3. 检验所有的共享磁盘是否都格式化为NTFS,并指定为基本。如果连接新的驱动器,签名和升级磁盘向导将自动启动。如果是这样,单击下一步,完成该向导。该向导将磁盘设置为动态。为将磁盘重新设置为基本,右键单击磁盘#(这里的#代表所使用的磁盘),并单击还原为基本磁盘。
4. 右键单击未分配的磁盘空间。
5. 单击创建分区。
6. 启动创建分区向导。单击下一步两次。
7. 以MB为单位,输入期望的分区大小。单击下一步。
8. 单击下一步,接受指定的缺省驱动器字母标号。
9. 单击下一步,格式化并创建分区。
指定驱动器字母标号
在设置了总线、磁盘和分区后,必须给每个群集磁盘的每个分区,指定驱动器字母标号。
注:安装位置是文件系统的一个特性,它允许使用现有的目录,来安装文件系统,而不需要指定驱动器字母标识。在群集中,不支持安装位置。任意作为群集资源的外部磁盘,都必须以NTFS进行分区,并必须为其指定驱动器字母标识。
1. 右键单击期望的分区,并选择改变驱动器字母标识和路径。
2. 选择新驱动器字母标识。
3. 对每个共享驱动器,重复步骤1和2。
4. 在完成后,计算机管理窗口外观应该如图6所示。现在,关闭计算机管理窗口。
检验磁盘访问和功能
1. 单击开始,单击程序,单击附件,并选择记事本。
2. 在记事本中输入一些词,并使用文件/保存为命令,将它保存为名为test.txt的测试文件。关闭记事本。
3. 双击我的文档图标。
4. 右键单击test.txt,并单击拷贝。
5. 关闭窗口。
6. 双击我的电脑。
7. 双击共享驱动器分区。
8. 单击编辑并单击粘贴。
9. 现在,在共享磁盘中有一个该文件的拷贝。
10. 在共享磁盘中,双击test.txt。关闭该文件。
11. 加亮显示该文件,并按删除键,将它从群集磁盘中删除。
对所有的群集磁盘重复该过程,检验是否可以从首节点处访问它们。
这时,对首节点断电,对第二个节点上电,重复上面的检验磁盘访问和功能的步骤。对其它节点作再次重复。当完成检验过程,确定所有节点都可对磁盘读写,则关闭除首节点外的所有节点,并继续该指南。
4. 安装群集服务软件
配置首节点
注:在首节点上进行群集服务的安装过程中,所有的其它节点都应关闭,或在Windows 2000重启前关闭。应该对所有的共享存储设备加电。
在安装的第一个阶段,必须提供所有的初始配置信息,以创建群集。这可以通过群集服务配置向导来完成。
1. 单击开始,单击设置,并单击控制面板。
2. 双击添加/删除程序。
3. 双击添加/删除Windows组件。
4. 选择群集服务。单击下一步。
5. 群集服务文件位于Windows 2000 Advanced Server或Windows 2000 DataCenter ServerCD-ROM里。输入:x:\i386(这里的x是你的CD-ROM的驱动器字母标识)。如果Windows 2000是从网络上安装的,则输入适当的网络路径。(如果显示Windows 2000安装屏幕,关闭它。)单击确定。
6. 单击下一步。
7. 将显示下面图7所示窗口。单击我理解,接受安装条件-所用硬件在硬件兼容列表中都可找到,它们都支持群集服务。
8. 由于这是该群集中的首节点,所以必须创建群集本身。选择群集中的首节点,如下面图8所示,然后单击下一步。
9. 输入群集名称(最多15个字符),并单击下一步。(在我们的例子里,该群集被命名为MyCluster。)
键入群集服务帐号的用户名,它是在安装前创建的。(在我们的例子里,该用户名是cluster。)不输入口令,键入域名,并单击下一步。
注:通常要为该用户帐号提供安全口令。
在这里,群集服务配置向导将会使用户帐号和口令生效。
10. 单击下一步。
配置群集磁盘。
注:缺省情况下,所有的SCSI磁盘都不是位于同一总线,系统磁盘将会出现在被管理磁盘列表中。因此,如果有某节点有多个SCSI总线,被列出的一些磁盘将不是被用于共享存储(如,作为内部SCSI驱动器)。这些磁盘应该从被管理磁盘列表中删除。
11. 添加/删除被管理的磁盘列表对话框如图9所示,它指定了哪个共享SCSI总线可用于群集服务。根据需要添加/删除磁盘,然后单击下一步。
请注意,由于逻辑驱动器F:和G:都位于一个硬盘上,群集服务将它们看作是一个资源。缺省情况下,第一个磁盘的第一个分区是作为定额资源。改变它,将先前所创建的小分区作为定额磁盘(在我们的例子里,是驱动器Q)。单击下一步。
注:在生成群集场景时,必须为群集通信使用两个以上(含两个)的内部网,避免单点故障。群集服务可在群集状态信号和群集管理方面,使用内部网。跟使用公众网相比,这有更高的安全性。也可以使用公众网进行群集管理,或者可以同时使用内部和公众通信。在任何情况下,确保至少有两个网络用于群集通信,因为使用单个网络进行点对点的通信,可能会存在着单点失效的故障。我们建议:使用多个网络,在节点间配置至少一个内部网,其它连接通过公众网。如果使用两个以上(含两个)的内部网,确保它们分别使用不同的子网,这是因为群集服务对于每个子网,只能识别一个网络接口。
本文档是基于这样的假设:只使用了两个网络。这将向你说明如何配置这些网络为一个混合的、内部的网络。
群集服务配置向导里给出的网络顺序是可变的。在本例里,首先给出公众网。
12. 在配置群集网络对话框中,单击下一步。
13. 确保网络名称和IP地址跟公众网里的网络接口一致。
14. 选中该网络可用于群集复选框。
15. 选中所有的通信(混合网络)选项,如下面图10所示。
16. 单击下一步。
17. 下一个对话框如图11中所示,是用来配置内部网。确保网络名称和IP地址跟内部网的网络接口一致。
18. 选中该网络可用于群集服务复选框。
19. 选择只用于内部群集通信选项。
20. 单击下一步
21. 在本例子中,两个网络都以这样的方式设置:它们都可以用于内部群集通信。在下一步对话框中,可修改使用网络的顺序。由于内部群集连接是节点间的直接连接,它位于列表的顶部。在正常的操作中,该连接将用于群集通信。如果内部网络连接失效,群集服务将自动切换到表里的下一个网络,在本例里,是公众群集连接。确保表里的第一个连接是内部群集连接,并单击下一步。重要提示:设置连接的顺序,把内部群集连接排在表中的第一位。
22. 输入唯一的群集IP地址(172.16.12.20)和子网掩码(255.255.252.0),并单击下一步
23. 单击完成,完成首节点的群集配置。
通过拷贝所需要的文件,群集服务安装向导将完成首节点的安装过程,从而完成群集服务的安装。当完成文件拷贝后,将生成群集服务注册入口,在定额资源上创建日志文件,并在首节点上启动群集服务。
将出现一对话框,告诉你群集服务已成功启动。
24. 单击确定。
25. 关闭添加/删除程序窗口。
使群集安装生效。
使用群集管理插件,使首节点上的群集服务安装生效。
单击开始,单击程序,单击管理工具,并单击群集管理器。
如果你的插件窗口跟上面图13类似,那么,已经在首节点上成功地安装了群集服务。现在准备在第二个节点上安装群集服务。
配置第二个节点
注:在这一部分,当对第二个节点上电的时候,让首节点和所有的共享磁盘都保持在上电状态。
在第二个节点上安装群集服务,所花时间要比在首节点上安装少。基于首节点的配置,在第二个节点上,安装配置群集服务网络设置。
象在首节点上安装群集服务一样,对第二个节点开始进行安装。在安装第二个节点时,必须运行着首节点。
接下来的过程跟在首节点上在安装群集服务大体相同,只有下列的不同之处:
1. 在创建或添加群集对话框中,在群集中选择第二个或下一个节点,并单击下一步。
2. 输入前面所创建的群集名称(在本例中,是MyCluster),并单击下一步。
3. 将连接到群集设为未选中。群集服务配置向导将自动提供,在安装首节点时选定 的用户帐号名称。
4. 输入该帐号的口令(如果有的话),并单击下一步。
5. 在下一个对话框中,单击完成,结束配置。
6. 将启动群集服务。单击确定。
7. 关闭添加/删除程序
如果要安装额外的节点,重复这些步骤,以便在其它节点上安装群集服务。
5. 检验安装
有几种方法,可以用来检验群集安装是否成功。下面给出一个简单方法:
1. 单击开始,单击程序,单击管理工具,并单击群集管理器。
显示的两个节点(图中的HQ-RES-DC01和HQ-RES-DC02)表明,存在群集,而且它在运行。
2. 右键单击对磁盘组1编组,并选中移动选项。该组及其所有的资源将被移到另一个节点。在一小会时间后,磁盘F:和G:都移到了第二个节点上了。如果查看屏幕,将会看到这个移位。关闭群集管理器插件。
恭喜。你已经在所有的节点上完成了群集服务的安装。该群集服务器是完全起作用的。现在,准备安装群集资源,诸如:文件共享、打印机后台打印程序、以及群集觉察服务,如:IIS、消息队列、分布式事务协同、DHCP、WINS,或者群集觉察应用程序,如Exchange或SQL Server。
6. 附录:SCSI驱动器的安装
该附录为SCSI驱动器的安装,提供了一个基本的使用说明。如果SCSI硬盘供应商的使用说明,跟这里介绍的相冲突,那么,使用供应商提供的说明。
在硬件要求中列出的SCSI总线,必须在群集服务安装之前配置,这包括:
1. 配置SCSI设备。
2. 配置SCSI控制器和硬盘,以便在共享的SCSI总线里正常地工作。
3. 正常地端接总线。对于共享SCSI总线来说,每个总线的末端都必须有一个终端适配器。可以在群集的节点之间,有多个共享的SCSI总线。
除了后续页面的信息外,请参考SCSI设备制造商的文档或SCSI说明,可以向美国国家标准署(ANSI)订购这些资料。ANSI的网站上有一个分类,可在那里找到SCSI的说明。
配置SCSI设备
每个在SCSI总线上的设备,都必须有一个唯一的SCSI ID。由于大多数SCSI控制器的缺省值为SCSI ID 7,在配置共享SCSI总线部分时,将会把其中一个控制器的SCSI ID修改为另一个SCSI ID,如SCSI ID 6。如果在该共享总线上有多个磁盘,每个磁盘也都必须要有一个唯一的SCSI ID。
在启动执行初始化时,一些SCSI控制器将会把SCSI总线复位。如果是这样,该总线复位将中断在共享总线上的,其它节点和磁盘之间的,任意数据传输。因此,如果可能的话,要禁止SCSI总线复位。
端接共享SCSI总线
如果在SCSI总线的末端有设备的话,就可以将Y线缆连接到该设备上。然后可以将终端适配器接到Y线缆的一个分支上,端接SCSI总线。这种端接方法要求禁止或删除设备的(可能有的)内部终端适配器。
可以将三头连接器连接到特定的设备上。如果该设备位于总线末端,可以用三头连接器来端接总线。这种方法也要求禁止或删除设备的(可能有的)内部终端适配器。
Y线缆和三头连接器都是推荐的端接手段,这是因为,即使在线上没有节点,它们也可以提供端接。
注:任意没有位于共享总线末端的设备,都必须禁止其内部的终端适配器。
注:以上文献部分引用了微软公司的技术文档。
总结:在双机热备和服务器集群实施过程中,出现了不少问题,主要有一下几点,希望大家在以后操作中可以避免。
1、共享磁盘之中 X 盘的重要性。在测试过程中,我删除了X盘上的一个文件,我重新启动两台节点和集群。一切正常,进入 X 盘看他的文件,发现被删除的文件又回到了里面。但是下面的操作直接导致我的整个系统崩溃,在我的电脑管理里面的调整了磁盘管理,把 X 盘删除了。悲剧发生了,在不到 10 秒钟的时间内两台节点相继报告机群服务发生错误将不能运行且终止服务。我再进入磁盘管理时,发现阵列的磁盘已经变成了不可读取。最后我不得不重新启动所有设备,希望能恢复。但是无效,集群服务无法启动,阵列磁盘不可读取。最后不得不重新配置了集群服务!!!!
2、在做用户数据库切换的时候,发现Windows 2000 DataCenter Server的性能要高于Windows 2000 Advanced Server,前一个切换一次几乎是瞬间完成,后一个延迟了将近10多秒,当时的环境是具备2000SQL,不知道是不是SQL引起的,由于时间有限没有详细研究。