分类:
2011-03-29 15:21:14
现象描述: | 某局点机房意外断电;其机房内有VCS集群服务器集,集群服务器集共有四台服务器,三台业务服务器分别运行Oracle 9i\Ms SQL 2000\MS SQL 2005数据库。一台备机分别与三台业务主机组成集群服务组.断电后四台服务器均不能启动VCS服务,Veritas High availability engine服务处于暂停状态,多次尝试启动Veritas High availability engine都马上处于暂停状态。 |
原因分析: | 运行hastatus -summary命令发现所有主机处于ADMIN_WAIT状态。 所有主机处于ADMIN_WAIT状态,一般由main.cf文件不一致造成 |
处理过程: | 1、首先尝试在各主机节点上运行 hasys -force [HOSTNAME] 强制启动VCS服务,结果只有节点VCSSVR1可启动VCS;其它节点都不能正常启动。 2、运行 hastop -all -force 强制关闭所有节点VCS服务。 3、在VCSSVR1上执行 hacf -verify "C:\Program Files\Veritas\cluster server\conf\config\." 验证main.cf文件,确定配置文件正确。 4、将VCSSVR1的main.cf文件分别复制到其它节点的C:\Program Files\Veritas\cluster server\conf\config\目录下。 5、在各节点上执行 hacf -verify "C:\Program Files\Veritas\cluster server\conf\config\." 验证main.cf文件,确定配置文件正确 6、在各节上执行 hastart 启动VCS服务。 7、在一节点上执行hasys -state查看VCS运行状态,各节点都处于RUNNING状态,VCS服务已启动,问题解决。 hasys -state #System Attribute Value VCSSVR1 SysState RUNNING VCSSVR2 SysState RUNNING VCSSVR3 SysState RUNNING VCSBACKUP SysState RUNNING |
建议/总结: | 服务器断电后最好先通过hacf验证main.cf文件后再启动VCS.另外每次配置完VCS集群服务组后务必通过haconf -dump -makero将配置文件设为只读.这些VCS服务会自动将main.cf文件同步至其它主机节点。 |