Chinaunix首页 | 论坛 | 博客
  • 博客访问: 44434027
  • 博文数量: 384
  • 博客积分: 9990
  • 博客等级: 中将
  • 技术积分: 5644
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-05 17:44
文章分类

全部博文(384)

文章存档

2011年(1)

2008年(383)

分类: 服务器与存储

2008-06-06 06:25:37

1.5 DataWare的软件方面

DataWare核心包含所有的系统程序,在安装时,程序“dwinst”将核心文件写到 “/usr/lib/dataware/exec”这个子目录下。

“dw.cfg” 系统文件是DataWare的配置文件,DataWare核心运行时,此文件的内容作为参考数据,”dwinst”将自动读取”dw.cfg”和系统表,构成用以维持系统正常运行的参考数据文件,并放在目录 “/usr/lib/dataware/configuare”下。

“dw.cfg”文件同时也定义双机系统的运行规则,如服务器运行模式:Dual Active或Hot Standby。用户可以根据实际应用情况通过此文件作正确的配置。

“5MB 裸设备”是在 “/dev”目录下的一个UNIX裸设备文件,这块区域称为”握手”通信区,两台服务器的”心跳”信息放到这块区域上,以便让核心来检查服务器是否正常。一旦核心检查到生产机心跳停止,则核心将通TCP/IP协议路经确认生产机是否真正当机或是失效。如果生产机确实当机或无效,则Heartbeat Monitor(心跳侦测)自动将生产机的关键性业务切换到备份机上。

Host A and Host B file system 是UNIX文件系统,根据用户需求可建立一个或多个文件系统分区。在RAID 系统的保护下,用户不必担心数据丢失。

DataWare提供用户易于使用的“dw.cfg” 系统文件,在DataWare软盘上,提供两个系统文件模板”cfg.a”和“cfg.b”。

Heartbeat Monitor是这样一个软件过程,它通过从”握手”通信区(5MB裸设备) 收集心跳侦测信息,去确定两台服务器是否有效,有两条途径可以确定服务器是否真正有效,当心跳侦测发现生产机无效时(5MB裸设备),则心跳侦测会通过TCP/IP协议路径发送信息到生产机,再次确认生产机的情况,如果情况属实,则心跳侦测发送一个信号到”Take Over Engine”。

”Take Over Engine”是一个控制程序,这个程序只接收Heartbeat Monitor程序和”jswitch”命令的信号,当收到信号后,引擎依照”dw.cfg”文件执行接管。

1.6 DataWare的工作原理

1.        服务进程

*双服务器采用TCP/IP协议与用户连接
*双机后台对于Client/Server用户透明

网络服务:双机后台对于用户一端,由监控软件DataWare 提供一个 IP地址,如:170.200.80.99,任一用户向双机系统发出数据请求只需要通过这一地址。当后台有一台服务器出现故障时,DataWare会在另一台服务器上将其网卡的IP地址更改为170.200.80.99;这样,用户一端的应用可继续访问数据或经过短暂停顿后恢复正常访问,而不会因为一台服务器出现故障而使整个应用系统不能再继续工作。

数据库服务:当有一台服务器出现故障时,DataWare会在另一台服务器上自动启动数据库引擎(engine);同时启动服务器端的应用程序,使用户端应用可以继续工作,而不受影响。

2.        监控原理

DataWare 侦测心跳通过两条途径:

SCSI 侦测:

对于某一台服务器而言,将侦测讯息以记录方式写在一大小为5MB的裸设备上,其中每一条记录包括如下内容:

(1)系统对本机的监测状态信息。

(2)另一台主机是否看到本机状态信息。

当一台主机有出现故障时,对等主机的可调变心跳频率不断提高;在最小心跳时间内发现记录内容没有更新;DataWare 即会调用网络心跳侦测,再次确认系统状态;当通过两组心跳侦测都确定系统出现故障时,DataWare将故障主机的交易业务在最小安全切换时间内切换到对等主机继续运行,同时修改记录区内容。一般情况切换时间不会超过7秒;根据应用程序的复杂程度,一般最小安全切换时间不超过30秒。

网络侦测:

DataWare对业务主机的网络设备进行监测,同配合SCSI心跳侦测,对等监控两台服务器主机的工作状态。当有一台服务器因为网络故障或其他原因引起故障而不能正常处理业务交易时,对等主机的可调变心跳频率不断提高;在最小心跳时间内发现没有回应,即会调用SCSI心跳侦测再次确认系统状态;当通过两组心跳侦测都确定判断系统出现故障时,DataWare将故障主机的交易业务在最小安全切换时间内切换到对等主机继续运行,同时修改记录区内容。

3. 监控的对象资源:

数据库的运行状态

用户应用程序运行

UNIX操作系统运行状态

服务器硬件设备状态

服务器网络设备(网卡,网线)

1.7 总结
DataWare for UNIX提供了一种基于UNIX操作系统的高性价比的HA解决方案。为用户提供了数据永不丢失和永不停机的保障,使用户的数据源系统达到近乎无错的状态。以下章节将详细介绍DataWare for UNIX的安装和维护的要点。

阅读(605) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~