Chinaunix首页 | 论坛 | 博客
  • 博客访问: 36089
  • 博文数量: 8
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 70
  • 用 户 组: 普通用户
  • 注册时间: 2015-05-06 16:12
文章分类

全部博文(8)

文章存档

2017年(6)

2016年(2)

我的朋友

分类: AIX

2017-01-04 16:40:14

转载请注明出处!
本次遇到的问题以及处理办法:
    hdisk0、hdisk1是rootvg中两块镜像盘,errpt中报hdisk1 P H 错误,经检查确认hdisk1为故障盘,rootvg中hdisk1状态为missing。
    换盘时将hdisk1上的lv通过migratepv命令移动到hdisk0上,但是/var目录执行此命令失败,查看/var对应的lv状态(如图一所示),有37个PP处于stale状态,但是topas查看磁盘读写几乎为零。再使用lspv -p hdiskx命令查看两块盘的lv信息(如图二、三所示),初步判断/var文件系统异常。使用rmedv删除hdisk1失败,使用tar备份/var目录到/目录下,同事强制将hdisk1拔除,尝试重启,但是机器开机失败,关机将hdisk1插回后可以开机,开机后使用磁带备份失败。
    根据以上所了解的信息,给出以下方案:插块新盘hdisk3加入rootvg,使用mklvcopy命令,将所有lv迁移至新盘hdisk3一份(迁移过程中磁盘几乎没有读写,使用syncvg后迁移lv成功)。bosboot命令添加引导信息到hdisk3,此时遇到报错(图四所示),各种命令都尝试过后依然不能在hdisk3建立引导信息,于是将原hd5删除手动创建后成功,修改bootlist使系统从hdisk3启动,重启系统。
图一:

图二:




图四:




    通过HMC关测,系统启动时一直卡在0518代码处,信息是Remote mount of the root (/) and /usr file systems failed during network boot.在官网查找报错解决办法,即使在维护模式中对/var执行fsck也会失败,所以大胆尝试在维护模式删除hd9var,手动建立新的hd9var,将之前备份的/var目录解压到新的/var文件系统中,重启后成功。注意:进入维护模式后hdisk_name可能会改变,注意记录盘的位置区别新旧盘!!
    因不确定是否是盘有坏块导致/var目录异常,所以开机后将原来的hdisk0和hdisk1全部删除拔出,再插入一块新盘加入到rootvg做mirror,但此时又出现一个问题:errpt命令不好使,错误提示忘记保存。尝试几个百度上的办法未果后,将另一台相同环境系统的/var/adm/ras/errtmpit拷贝到本机上替换原来的/var/adm/ras/errtmpit后,errpt执行成功。
    至此未发现有其他异常,客户业务运行一周也未发现异常。
阅读(3754) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~