Chinaunix首页 | 论坛 | 博客
  • 博客访问: 43662526
  • 博文数量: 384
  • 博客积分: 9990
  • 博客等级: 中将
  • 技术积分: 5644
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-05 17:44
文章分类

全部博文(384)

文章存档

2011年(1)

2008年(383)

分类: 服务器与存储

2008-06-06 06:11:24

一、重视双机热备的启动程序

    双机热备系统的开机顺序是必须重视的,我们以前不久机房的一次断电事故来说明双机热备系统启动程序的重要性。

    由于单位进行机房改造,需要切换市电。为保证业务不间断运营,我们通过60KVA的梅兰日蓝UPS给机房提供不间断供电,同时考虑到60KVA所带的负载较重,关闭了一些不重要的服务器,也做了一些应急措施。但是当机房停电5分钟时间后,UPS突然宕机,随即机房的所有网络设备和服务器全体“罢工”。

    检查UPS发现供电电池出现问题,不能提供30分钟的正常供电,我们只好重新恢复市电工作。断电前由于没有及时关闭P630小型机和7133磁盘阵列的电源开关,当市电启用时,小型机和7133磁盘阵列也就自动启动了。

    AIX系统起来后,我们到两台小型机上查看运行ORACLE数据库和应用系统时,发现找不到“数据盘”,用Lsvg显示当前系统的所有卷组,发现只有rootvg,没有datavg,而数据卷组是放在7133磁盘阵列上的。这就是典型的因为掉电造成的非正常关机和开机导致了无法正常启动。

    在这个方案中,双机热备系统正确的开机步骤应当是这样的:

  • 先开外设如磁盘阵列7133和磁带机
  • 然后再开两台主机A和B
  • 等主机AIX系统启动后,然后再分别启动HACMP服务,注意不能同时启动HACMP服务
  • 最后启动ORACLE数据库和应用系统。
  • 关机则正好相反,先关闭ORACLE数据库服务和应用系统,再停止HACMP服务,然后关闭主机系统,最后关闭磁盘阵列7133和磁带机。

    所以启动双机热备系统的时候遵循正确的启动程序非常重要,在上面的案例中,因为来电时,小型机和磁盘阵列同时启动,等AIX启动好后就认不出磁盘阵列等外设了。解决方法是关闭小型机和7133磁盘阵列,再按照规范开机顺序开启系统,等AIX系统起来后,启动HACMP,再查看数据卷组时,就能找到了。启动数据库和应用服务,测试结果一切正常。这一点与现在的PC机操作不同,外设和主机同时启动都不会出什么问题的。

    此外,在使用HACMP服务时,两台小型机也不能同时打开,必须按先后顺序来开机。这是因为我们采用的双机热备模式是主从热备,启动HACMP服务的先后顺序决定了哪一台作为主机,哪一台作为备机。因此,当两台机器同时启动的时候,就会造成HACMP服务运行“混乱”,结果当一台小型机发生故障时,另外一台小型机不能进行自动接管,不能真正达到双机热备的效果。

    同样地关机时也要严格按照关机顺序,如果先关闭7133磁盘阵列时,就有可能引发的数据丢失。这必须要引起大家在运行维护中高度重视,否则的话,造成数据丢失,后果将是非常严重的。

阅读(1142) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~