Chinaunix首页 | 论坛 | 博客
  • 博客访问: 44667217
  • 博文数量: 384
  • 博客积分: 9990
  • 博客等级: 中将
  • 技术积分: 5644
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-05 17:44
文章分类

全部博文(384)

文章存档

2011年(1)

2008年(383)

分类: 服务器与存储

2008-06-05 19:11:13

RoseHA双机热备软件 

  在双机热备的架构中,除了要考虑切换时间外,要根据每个系统的作业环境,包括网路系统是单网或是双网,数据库的安装和作业内容及用户端的设备是经由广域网路、区域网路接入不同用户有不同的需求,而要求有不同的切换模式,所以选择不同的切换模式,可以使用户端的改变达到最少的程度。
  ROSEHA根据不同的行业及各行业不同的需求设计多种备援模式以弹性的调适用户的最佳组合及选择。 

ROSEHA系统运作方式 
  在正常的运作情形之下,主机之间透过冗余侦测线路互相侦测,当任一主机有错误产生时,ROSE HA提供严谨的判断与分析,确认主机出错之后,才完全启动备援接管动作。
支持各种操作系统平台,包括Windows NT/2000/2003、SCO Openserver/Unixware、Linux、Solaris等。 

  RoseHA支持各种数据库:MS-SQL、Oracle 、Inform ix、Sybase、Lotus/Nose、DB2等 


接管动作包括 

文件系统( File System)
数据库( Database) 
网络地址( IP Address) 
应用程序(AP) 
系统环境(OS)
----------------------------
LifeKeeper软件介绍 

 美国SteelEye公司的LifeKeeper 是一种支持多种软(WindowNT, Windows2000, 多种Linux等)、硬件平台的高性能容错软件,最多可支持16台服务器集群。Lifekeeper软件源于美国NCR公司及著名的AT&T贝尔实验室。为企业、银行、政府等的信息服务,商务服务,政务服务等提供高可用性解决方案。 

 LifeKeeper属于高可用容错集群软件,运行于NT、Windows 2000、Linux和NCR Unix平台。同时支持纯软件镜像方式和共享磁盘阵列柜方式,并支持远程灾难实时复制备份恢复系统。使用户的服务器、操作系统、数据库系统以及关键的数据及应用程序保持7天×24小时连续不间断,提供99.99%的高可用性。软件包括核心部分和一些针对不同应用的ARK。 

LifeKeeper的关键特点 

 1.不用增加任何额外硬件投资,纯软件方式实现双机容错,且对备机无硬件配置要求。
  
 2.可支持Notes、Exchange、SQL Server、Sybase、Inform ix、Oracle 、SAP等多种系统的应用层热恢复。
  
 3.是全球第一套基于NT操作系统的容错软件并同时支持LINUX平台。支持远程灾难备份。
  
 4.支持共享磁盘阵列柜和扩展镜像两种方式,给用户提供了选择上的灵活性,同时也能适应各种机型、网络结构、软件平台及应用系统。
  
 5.LifeKeeper在扩展镜像或共享磁盘阵列任意方式下,均能实现两台服务器各自运行不同应用且相互热备份,即实现双Active运转模式。
  
 6.使用共享磁盘阵列柜方式时,最多可以支持16个节点,远远大于其它类似系统所支持的2个节点数。
  
 7.最大限度地保护用户端的应用连续性。用户的硬件资源(如网卡),软件资源(如NT操作系统、数据库管理系统、数据库应用系统、电子邮件系统等)均能处于LifeKeeper的保护之下,当这些被保护资源出现技术故障时,LifeKeeper可随时实施系统资源切换。如此,LifeKeeper真正实现了用户硬件或是软件资源发生故障时系统及应用层上的在线热切换。
  
 8.LifeKeeper占用系统资源极少,不增加网络负荷,且不打扰任何具体应用系统的任何操作。
  
 9.LifeKeeper真正实现无人值守,全自动地实现应用资源切换,且图形界面操作,简单方便。
  
 10.自投入使用以来,已经历了大量交易高峰的实际考验,其执行效率很高且运行十分稳定可靠,全球市场占有率第一。
-----------------------
Pluswell软件介绍 

 PlusWell 提供两种产品:实现双机热备容错的PlusWell Cluster容错软件和基于纯软件镜像方式实现备份的PlusWell Mirror软件。 

 PlusWell Cluster容错软件提供了一个完全容错的软件解决方案,并提供数据、应用程序和通信资源的高度可用性。容错软件不需要任何特别的容错硬件,并访问特定节点的配置数据。容错软件会自动地提供错误检测和现场恢复。 

 在出现故障的情况下,PlusWell Cluster容错软件会将保护资源自动转换到一个根据预先设定好优先权的系统。在实际进行切换用户时,会经历一个十分短暂的休眠,但是,当系统完成了切换操作后,容错软件会在所选择的节点上自动地恢复操作。
  可以被PlusWell Cluster容错软件保护起来的资源是: 

卷(Volume) 
IP 地址 
共享文件 
管理器服务器名称 
应用程序 
定义的用户 
 PlusWell提供Mirror(镜像)软件,用户无需较贵共享磁盘阵列,也不必考虑主机的距离,主服务器的数据通过Mirror软件将数据实时的复制到备用服务器上,保证主备服务器上的数据的一致性,这样与集群软件配合,完成主备服务器的集群热备功能。 

增量镜像功能:镜像软件可以做到数据的增量镜像,当备故障停机或用户重启备机后,主机以增量方式向备机做数据的镜像,这保证的数据的安全性和用户的使用。
数据备份功能:镜像软件可以做到一点对多点的实时镜像功能,同时也可以做到本机的数据实时复制 

PlusWell产品规格、版本与价格 

下表为Pluswell的产品规格及标准价格: 

产品编号 产品规格描述 版本 列表价(RMB) 
Windows NT/2000 Server 平台 

N510-2000 
PlusWell Cluster HA ,Windows NT/2000 ,光盘、手册及使用授权(2服务器)
5.0 
28,500.00 

N210-2001 
PlusWell Mirror,Windows 2000, 光盘、手册及使用授权(2服务器)
2.0 
19,000.00 

Windows 2003 Server 平台 

N513-2003 
PlusWell HA Cluster for Windows2003, 光盘、手册及使用授权(2服务器)
5.0 
28,500.00 

N211-2003 
PlusWell Mirror,Windows2003, 光盘、手册及使用授权(2服务器)
2.0 
26,600.00 

Linux平台 

N400-0001 
PlusWell HA Cluster,Red Hat Linux, 光盘、手册及使用授权(2服务器)
4.0 
28,500.00 

N300-0002 
PlusWell Mirror,Red Hat Linux, 光盘、手册及使用授权(2服务器)
3.0 
23,750.00 

SCO Unix平台 

N500-0001 
PlusWell HA Cluster,SCO UNIX, 光盘、手册及使用授权(2服务器)
4.0 
28,500.00 

PlusWell双机热备安装方法(来自squall个人Linux/Unix站点) 

一 硬件需要: 

1. IBM X-Series 或 Netfinity 服务器两台,要求两台硬件配置相同 
(本实验中采用两台X235-21X及一台8479-62X) 
2. 外置磁盘扩展柜一台(例如EXP15,EXP200,EXP300......) 
(本实验中采用EXP300) 
3. ServeRaid 4系列的阵列卡两块(4L,4M,4H,4MX) 
(本实验中采用4MX) 
4. 外置SCSI电缆两条(P/N: 03K9195) 
5. 串口心跳线一根(COM口直连,交叉线) 
6. 网络适配卡二块(由于主机服务器上一般至少有一块100/1000M网卡,所以 可以根据实际情况另行购买双机心跳网卡,10/100M网卡即可) 
7.10/100M交换机或10/100MHUB 

二 软件需要: 

1. PlusWell Cluster软件一套 
PlusWell Cluster软件由北京蓝科泰达科技有限公司或是由相应的代理商提供 
2. IBM ServeRAID BIOS/Firmware Update Diskette(4.84) 
陈列卡所带的光碟做陈列时会自动升级 
3. IBM ServeRAID Manager (v4.50) 
陈列卡所带的光碟中带有 
4. Windows 2000 Server CD 
客户需要购买两套Windows2000 Server/Windows2000 advanced Server 
5. 服务器 数据库 软件 
6. 其他相关的软盘(例如网卡驱动等会随选件购买而带) 

三 硬件安装步骤: 

1.连接好主机,键盘,鼠标,显示器 
2.分别插入主机和磁盘扩展柜的硬盘 
3.打开主机箱盖,依次插入ServeRaid卡 和 网络适配卡 
4. 用SCSI电缆(03K9195)将每一台主机的ServeRaid卡和磁盘扩展柜后端接口相连 
(其中SCSI电缆与ServeRaid卡联接时必需接到同一个通道上) 
5.将每台主机中一块网卡用直连线连接(心跳线联) 
6.将每台主机中的另一块网卡和网络连接 
7.将串口线连接在两台主机的COM1之间或COM2之间 
8.接好主机的磁盘扩展柜的电源 

 

 

四 软件安装步骤: 

(1) 升级 ServeRaid 卡的 BIOS 

1. 将陈列卡所带的光碟插入一台服务器,引导服务器启动。 
2. ServeRaid 卡的 BIOS 升级完成后,关闭ServerB,打开ServerA。 
(两台服务器RAID卡BIOS中 write through选项均要设成:YES) 

(2) 安装操作系统 

3. 打开Server A, 关闭Server B, 磁盘扩展柜保持在开机状态 
4. 按照提示安装Windows 2000 Advanced Server 操作系统 
5. 安装ServeRaid Manager (v 4.50) 
6.将Server A配成域控制器并将100网卡的IP设成10.1.1.1掩码为255.0.0.0,千兆网设成192.168.0.1掩码为255.255.255.0。在实际应用中Server A并不一定要设成域控制器而是要加入其实际网络中已存在的域中,这样加入实际网络的域中可能对于群集更稳定。 
7. 关闭ServerA打开Server B 磁盘扩展柜保持在开机状态 
8. 按照提示安装Windows 2000 Server 操作系统 
9. 安装ServeRaid Manager (v 4.50) 
10. 将Server B配成域控制器并将跳线的IP设成10.1.1.2掩码为255.0.0.0千兆网设成192.168.0.2掩码为255.255.255.0) 

(3) 配置共享硬盘 

13. 打开Server A, 关闭Server B。磁盘扩展柜正常开启. 
14. 用陈列卡所带的光碟启动 
15. 语言选择“English” 
16. 键盘选择“Unite States”;鼠标选择“Unite States” 
17. 接收协议,按“NEXT” 
18. 选中操作系统“Windows 2K”,并同时选择“Run Setup Program and Configure Hardware"按“NEXT” 
19. 选择“Express" 按“NEXT” 
20. 设置“日期” 和 “时间” 
21. 点中“Controller" 图标按鼠标右键,选择“Create Array” 
22. 选择“Custome Configuration”,然后按“NEXT” 
23. 根据客户自己的需求创建阵列和逻辑驱动器 
24. 鼠标右键点击“Controller”,选择“Cluster Action”,然后选择“Configure for Clustering”
25. 然后会弹出一个窗口 

Controller Name : A 
Partner Name : B 
Chnnel 1 : 6 
Logical Drive : shared, Merge group = 1 (共享盘柜) 

(注意:如果服务器上的硬盘和共享盘柜在同一阵列卡上,那么本地硬盘所在逻辑驱动器选择 Non-shared 模式;而共享硬盘所在的逻辑驱动器选择Shared模式,最好把本地硬盘接到服务器的主板上,把单通道的RAID控制器卡的位置空出来,便于将来的扩展,也防止将来RAID卡坏掉时,整个服务器将完全瘫痪) 

如图所下: 

Controller Name : Node_A 
Partne Name : Node_B 
Chnnel 1 : 6 
Logical Drive1 : Non_shared Merge group = 200 (服务器上的本地硬盘) 
Logical Drive2 : shared Merge group = 1 (共享盘柜) 

26. 退出配置工具,并且关闭Server A. 
27. 打开Server B, 关闭Server A。磁盘扩展柜保持通电状态. 
28. 用陈列卡所带的光碟启动 
29. 语言选择“English” 
30. 键盘选择“Unite States”;鼠标选择“Unite States” 
31. 接收协议,按“NEXT” 
32. 选中操作系统“Windows 2K”,并同时选择“Run Setup Program and Configure Hardware"按“NEXT” 
33.选择“Express" 按“NEXT” 
34. 设置“日期” 和 “时间” 
35. 点中“Controller" 图标按鼠标右键,选择“Cluster Actions” 
36. 然后选择“Configure for Clustering” 

Controller Name : Node_B 
Partner Name : Node_A 
Chnnel 1 : 7 
Logical Drive1 : shared, Merge group = 1 (共享盘柜) 
Logical Drive2 : shared, Merge group = 2 (共享盘柜) 

37. 等待硬盘初始化和同步完成后,退出配置工具,并且关闭Server B. 

(4) PlusWell Cluster中的设置 

38. 登录进入Server A服务器,用Brows找到EXP300切换用的程序(ipha*.exe),一般在IBM EXP300的驱动程序盘的WINNT目录下。通常在C盘下建立一个pwcluster的目录,将该程序拷贝到此目录中。执行IPSHAHTO文件。这将对共享硬盘进行强行接管。 
39. 用“磁盘管理器”对磁盘阵列柜中的硬盘分配盘符,进行格式化,并设置卷标(注意:两台服务器对共享硬盘的盘符,硬盘大小,卷标名称应该相同;而且格式时选择NTFS模式) 
40.打开Server B。 
41.登录进入Server B服务器,用Brows找到EXP300切换用的程序(ipha*.exe),一般在IBM EXP300的驱动程序盘的WINNT目录下。通常在C盘下建立一个hacluster的目录,将该程序拷贝到此目录中。执行IPSHAHTO文件。这将对共享硬盘进行强行接管。 
42. 用“磁盘管理器”对磁盘阵列柜中的硬盘分配盘符,进行格式化,并设置卷标。 
(注意:两台服务器对共享硬盘的盘符,硬盘大小,卷标名称应该相同;而且格式时选择NTFS模式) 
43. 完成后关闭Server B 
44. 在两台服务器上安装PlusWell 双机热备软件,并做相应的应用 

五 安装中常见的问题及解决方法 

1. 单通道RAID控制器卡的安装 
一般服务器的主板上都集成有至少一个SCSI接口,用于安装本地硬盘。当客户自己对硬件不太熟悉时,可能把本地硬盘也接到RAID控制卡上。这时,最好把本地硬盘接到服务器的主板上,把单通道的RAID控制器卡的位置空出来,便于将来的扩展,也防止将来RAID卡坏掉时,整个服务器将完全瘫痪。 
2. 服务器正常关机后,正常开机时,PlusWell不能正常显示,呈灰色未知状态 
产生此状态的原因,可能是关机时服务器的主从状态与开机时的顺序不同造成的。将服务器关机,然后先开关机时是主机的服务器,正常启动后,再开备机。 
3. Raid 卡在设置过程中,先在一侧进行设置(如:作Raid 5,另一服务器关闭),再关掉该服务器电源;开另一服务器,作同样设置。 
4. 在Adaptec 阵列卡设置过程中,要将卡的一个Boot设置去掉,否则,有可能不能引导系统。 
5. 在做卷保护前,当给磁盘柜赋予盘符后,两侧都应当重新启动系统,再做卷保护。 
6. 在安装Adaptec Raid 卡时,不能将Raid卡插在有全长挡片的PCI槽位。 
EXP 300的RAID卡在服务器中,一般分为两个通道,一个接本机的硬盘,一个接外部的EXP300存储柜。 
7. 用IBM提供的RAID启动盘,对RAID卡进行设置,其中同一块卡上的channel1和channel2的通道ID相同,一块卡的channel均为6,一块卡的channel均为7(6和7为IBM仅允许的值)。 
实际上,只需保证接磁盘阵列柜的channel(通道)的ID在两块卡上不一样就可以了。 
8.在安装Oracle 数据库时,应打开一台服务器另一台关闭;在安装另一服务器时,同样操作。 

六 测试PlusWell Cluster安装是否成功 

-测试共享硬盘资源的接管功能。 
-将组从一个结点移至另一个结点。 
-确认一个客户端能够访问共享硬盘资源。 
-拔去主机1000M网卡的网线,组从一个结点移至另一个结点。 
-使某一结点断电,组从一个结点移至另一个结点,测试该接管功能。

========================================================================

顺便给大家补充一下关于双机热备份的一些常识: 

机热备份技术
  
  双机热备份技术是一种软硬件结合的较高容错应用方案。该方案是由两台服务器系统和一个外接共享磁盘阵列柜(也可没有,而是在各自的服务器中采取RAID卡)及相应的双机热备份软件组成,如图1所示。
[UploadFile=2005070811511548_1122989479.jpg]
在这个容错方案中,操作系统和应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。
  
  双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者备用系统无法收到主机系统的“心跳” 信号,则系统的高可用性管理软件认为主机系统发生故障,主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。
  
  双机热备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即:双机热备模式、双机互备模式和双机双工模式。下面分别予以简单介绍。
  
  双机热备模式即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby 服务器处于监控准备状态,服务器数据包括数据库数据同时往两台或多台服务器写入(通常各服务器采用RAID磁盘阵列卡),保证数据的即时同步。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。典型应用在证券资金服务器或行情服务器。这是目前采用较多的一种模式,但由于另外一台服务器长期处于后备的状态,从计算资源方面考量,就存在一定的浪费。
  
  双机互备模式,是两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。配置相对要好。
  
  双机双工模式:是目前cluster(群集)的一种形式,两台服务器均为活动,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份,需要利用磁盘柜存储技术(最好采用San方式)。WEB服务器或FTP服务器等用此种方式比较多。

阅读(626) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~