分类: 服务器与存储
2008-06-06 06:29:44
DataWare优化指南
5.1 Read me first (概要先述)
DataWare软件主程序/usr/lib/dataware,配有多组功能参数,用户可根据应用的实际情况设置不同的参数组合,这样在满足用户需求方面,只需调整参数而无需更换软件,就可实现不同的功能模式。
a. DataWare支持模式
DataWare软件支持系统达到以下三种功能模式:
双机单网卡主从热备 ; 后续章节简称“HS mode”
双机互备援 ; 后续章节简称“DA mode”
双机双网卡主从热备 ; 后续章节简称“HS mode”
b. 安装路径: /usr/lib/dataware
/usr/lib/ dataware主目录
--------------------------------------------------------------------
drwx------ 3 root sys 512 Jun 4 02:47 Record
drwx------ 2 root sys 512 Jun 4 04:12 Request
drwx------ 2 root sys 512 Jun 4 02:47 configure
drwxr-xr-x 2 root sys 512 Jun 4 02:47 exec
--------------------------------------------------------------------
*Record目录内容
--------------------------------------------------------------------
drwx------ 2 root sys 512 Jun 4 02:51 LOG
--------------------------------------------------------------------
*Record/LOG目录内容
--------------------------------------------------------------------
-rw-r--r-- 1 root root 1832 Jun 4 04:12 1998_06_04
--------------------------------------------------------------------
*Request目录内容
--------------------------------------------------------------------
total 0
--------------------------------------------------------------------
*configure目录内容
--------------------------------------------------------------------
-rw------- 1 root sys 32 Jun 4 02:47 ap_tables
-rw------- 1 root sys 75 Jun 4 02:47 ctl_tables
-rw------- 1 root sys 21 Jun 4 02:47 fs_tables
-rw------- 1 root sys 2 Jun 4 02:47 host_id
-rw------- 1 root sys 108 Jun 4 02:47 ip_tables
-rw------- 1 root sys 11 Jun 4 02:47 modem_device
-rw------- 1 root sys 8 Jun 4 02:47 pager_setup
-rw------- 1 root sys 1 Jun 4 02:47 pager_tables
-rw------- 1 root sys 15 Jun 4 02:47 reference_ip
-rw------- 1 root sys 11 Jun 4 02:47 scsi_device
-rw------- 1 root sys 12 Jun 4 02:47 dw_identify
-rw------- 1 root sys 8 Jun 4 02:47 dwmnt_cfg
-rw------- 1 root sys 1 Jun 4 02:47 ts_tables
--------------------------------------------------------------------
*exec目录内容
--------------------------------------------------------------------
-rwxr-xr-x 1 root sys 84962 Jun 1 13:38 iochk
-rwxr-xr-x 1 root sys 62724 Jun 1 13:38 jswitch
-rwxr-xr-x 1 root sys 233103 Jun 1 13:38 pingchk
-rwxr-xr-x 1 root sys 272408 Jun 1 13:38 dataware
-rwxr-xr-x 1 root sys 81419 Jun 1 13:38 dwcheck
-rwxr-xr-x 1 root sys 110444 Jun 1 13:38 dweng
-rwxr-xr-x 1 root sys 93167 Jun 1 13:38 dwinst
-rwxr-xr-x 1 root sys 111767 Jun 1 13:38 dwmjob
-rwxr-xr-x 1 root sys 110384 Jun 1 13:38 dwnt
-rwxr-xr-x 1 root sys 11208 Jun 1 13:38 dwread
-rwxr-xr-x 1 root sys 126768 Jun 1 13:38 dwsend
-rwxr-xr-x 1 root sys 83799 Jun 1 13:38 dwsetpsw
-rwxr-xr-x 1 root sys 62400 Jun 1 13:38 dwstop
-rwxr-xr-x 1 root sys 41242 Jun 1 13:38 dwtset
-rwxr-xr-x 1 root sys 110228 Jun 1 13:38 dwumjob
5.2 快读指南
参数举例
jswitch
手工切换命令,强制将生产机工作状态切换到备份机
dataware
启动DataWare主程序,默认方式是其后不跟任何参数,适用于单网卡主从热备模式或双机双控对等处理模式;
dataware -h
当主机负载过大(通常是业务主机执行一个很大的job,需要占用较多的系统资源,而完成job的时间也比较长),但此时业务主机运行正常,只是由于CPU没有空余的I/O分配给DataWare,对等服务器很久没有得到业务主机的心跳回应,DataWare开始怀疑业务主机有问题,为得到进一步确认,以避免不正常切换,DataWare要求再从网络心跳检查系统,进行确认。
dataware -r
在双网卡主从热备模式下启动DataWare,配置文件dw.cfg中网卡部分参考DA模式;但A和B不交换;
dataware -m -p30 -r
在双网卡主从热备模式下运行Auto Fail Back,而DataWare在takeover(接管)之后30秒后,开始监控应用和系统运行状态;
dataware -k(或 dataware -s stop)
停止DataWare的运行
可调整参数列表
dataware -s start = dataware
dataware –s stop = dataware -k
dataware -x
使用于DA模式;当生产机的 DataWare停止运行时,对等主机不接管任务,用户如果希望释放生产机的工作,可运行“jswitch”,而 DataWare继续运行;
dataware -r
运行双网卡主从热备模式;
dataware -m = dataware -a(auto take job back)
如果是DA模式,主机自动抓回自己的业务;在HS模式下,生产机强制抓回应用业务,继续充当生产机;
dataware -pXX
DataWare开始正常运行或发生切换接管(Take Over)完成后, DataWare等待XX秒以后开始监控应用程序运行状态,以及网络ARP表;XX缺省值设为10,即10x2=20秒,参数范围:6~90
dataware -tXX
DataWare正常启动后,在XX秒范围内,如果对等主机没有反馈响应信息, DataWare开始怀疑对等主机是否故障,为确认判断是否正确,在开始安装时如果已配置了“-f”参数,此时即刻调用“-f”参数确诊;如果没有配置“-f”参数,则判断为对等主机没有反应或故障, DataWare开始执行强行接管;XX缺省值设为10,即10秒,参数范围:6~40
dataware -fXX
DataWare在使用“-t”参数判断对等主机没有反应后,使用“-f”参数确诊,既每隔2秒检查一次,共检查XX次后,如果对等主机仍无反应,既判断对等主机确实故障,开始强行接管(Take-Over); XX缺省值设为10,即10x2=20秒,参数范围:6~90
dataware -i
初始化SCSI心跳的5MB磁盘柜逻辑盘小区,该动作已由软件安装程序“dwinst”做过,用户实际应用中不再需要
dataware -c
某些情况下,如果操作系统装的不好,系统在多用户状态运行时,进程管理的PS Table会不正常;为让 DataWare有效地管理服务进程,该参数强调提前 DataWare主进程的进程号,便于管理
dataware -cX
DataWare停止或切换过程是先停止AP应用,再执行DataWare stop,卸载文件系统,将网卡虚拟地址改回netconfig实际地址。但一般AP应用程序的停止都是调用一个UNIX Shell程序,让AP应用程序的运行状态完全停止,需要一个安全时间,不能立即完成;该参数是设置 DataWare是否等待AP应用程序完全停止,再做DataWare stop的动作;X的参考值设定如下:
-c0
表示 DataWare不管AP应用程序是否完全停止,即刻执行 DataWare stop的动作,将网卡虚拟地址改回netconfig实际地址。
-c1
表示 DataWare一定要等待AP应用程序完全停止下来,才执行 DataWare stop的动作,将网卡虚拟地址改回netconfig实际地址。
-c2
因为某些AP应用程序的停止,一定要在网络虚拟地址有效时进行,否则会造成一定的损失和故障,所以DataWare执行dataware stop的动作以前,需要等待一段时间,让AP应用程序完全停下来;具体要等待的时间设定将由“-e”参数补正, 格式设定如下:
-c2 –eX
即等待X时间后, DataWare才执行 DataWare stop的动作,X默认设为4(4x2=8秒);参数范围:1~40
dataware -dX = Debug
DataWare Debug调整,X设为不同值时,可一步一步地显示 DataWare工作状态
-d6
显示两台对等服务器及网络参考点网络运行状态
-d4
显示AP应用程序的执行状态,随时报告PS Table中AP应用程序的进程名字和进程号;
dataware -o
通常情形下,DataWare正常运行时,如果侦测到网络出现故障,网络心跳会加快侦测速率,同时会多检测几次,在网络安全测试时间内,如果网络确实故障,故障主机的DataWare会执行dataware stop的动作,让对等主机接管;但在某些情况下,网络的运行状态不一定非常稳定,所以根据应用的不同,需要DataWare在侦测到网络故障时,执行切换以后继续运行,”-o”的参数可满足这一要求。
dataware -bX
切换测试参数。
-b4
只检测 DataWare握手状态是否正常,可否进行正常切换; DataWare运行时,不做虚拟网址置换,不mount文件系统,不启动应用,不进行监测。
-b1
DataWare只检测网络,同时置换虚拟网址,如果网络有问题,检测切换是否正常。
-b2
DataWare只mount文件系统,并启动和监控AP应用程序;但不做虚拟网址置换,不监测网络;当AP应用程序故障,检测切换是否正常。
dataware -uX 网络稳定性检查
在完成网卡配置以后,及 dataware 初始化文件dw.cfg配置完成后,当系统进入Multi User多用户状态运行时,为检查网卡在 dataware运行前及 dataware开始运行已置换虚拟网址后,网络运行状态的稳定性,需要调用 dataware的网络检查工具“pingchk”; pingchk执行时会在对等的两快网卡之间做16次模拟网络交易,其报告结果为每一次交易网络通断次数,结果值“0”表示交易成功,结果值非0,表示通讯不正常;当16次模拟网络交易有50%以上非0,则表示当前的系统网络环境不适合 DataWare运行,若不改变当前网络系统配置而运行 DataWare的话,则必须调整“-u”,将“pingchk” 模拟网络交易16次结果超过12次以上测为“0”。
? 举例: Server A : 15.15.15.1 虚拟网址: 15.15.15.99
Server B: 15.15.15.2
? pingchk 15.15.15.99 errcnt=0 表示网络交易成功
delay,errcnt=14000,0
delay,errcnt=15000,0
delay,errcnt=16000,0
delay,errcnt=17000,0
delay,errcnt=18000,0
delay,errcnt=19000,0
delay,errcnt=20000,0
delay,errcnt=21000,0
delay,errcnt=22000,0
delay,errcnt=23000,0
delay,errcnt=24000,0
delay,errcnt=25000,0
delay,errcnt=26000,0
delay,errcnt=27000,0
delay,errcnt=28000,0
delay,errcnt=29000,0
? -uX: X参数选择范围 1~99,初始默认值为30