Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1979258
  • 博文数量: 346
  • 博客积分: 10221
  • 博客等级: 上将
  • 技术积分: 4079
  • 用 户 组: 普通用户
  • 注册时间: 2009-06-01 19:43
文章分类

全部博文(346)

文章存档

2012年(1)

2011年(102)

2010年(116)

2009年(127)

我的朋友

分类:

2011-03-29 15:21:14

现象描述:某局点机房意外断电;其机房内有VCS集群服务器集,集群服务器集共有四台服务器,三台业务服务器分别运行Oracle 9i\Ms SQL 2000\MS SQL 2005数据库。一台备机分别与三台业务主机组成集群服务组.断电后四台服务器均不能启动VCS服务,Veritas High availability engine服务处于暂停状态,多次尝试启动Veritas High availability engine都马上处于暂停状态。 
   
原因分析:

运行hastatus -summary命令发现所有主机处于ADMIN_WAIT状态。
-- SYSTEM STATE
-- System               State                Frozen
A  VCSSVR1            ADMIN_WAIT           0
A  VCSSVR2            ADMIN_WAIT           0
A  VCSSVR3            ADMIN_WAIT           0
A  VCSBACKUP     ADMIN_WAIT           0

所有主机处于ADMIN_WAIT状态,一般由main.cf文件不一致造成

                        
处理过程:1、首先尝试在各主机节点上运行 hasys -force [HOSTNAME] 强制启动VCS服务,结果只有节点VCSSVR1可启动VCS;其它节点都不能正常启动。
2、运行 hastop -all -force 强制关闭所有节点VCS服务。
3、在VCSSVR1上执行 hacf -verify "C:\Program Files\Veritas\cluster server\conf\config\." 验证main.cf文件,确定配置文件正确。
4、将VCSSVR1的main.cf文件分别复制到其它节点的C:\Program Files\Veritas\cluster server\conf\config\目录下。
5、在各节点上执行 hacf -verify "C:\Program Files\Veritas\cluster server\conf\config\." 验证main.cf文件,确定配置文件正确
6、在各节上执行 hastart 启动VCS服务。
7、在一节点上执行hasys -state查看VCS运行状态,各节点都处于RUNNING状态,VCS服务已启动,问题解决。
hasys -state
#System    Attribute          Value
VCSSVR1    SysState           RUNNING
VCSSVR2    SysState           RUNNING
VCSSVR3    SysState           RUNNING
VCSBACKUP  SysState       RUNNING
   
建议/总结:服务器断电后最好先通过hacf验证main.cf文件后再启动VCS.另外每次配置完VCS集群服务组后务必通过haconf -dump -makero将配置文件设为只读.这些VCS服务会自动将main.cf文件同步至其它主机节点。
阅读(3778) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~