Chinaunix首页 | 论坛 | 博客
  • 博客访问: 8236836
  • 博文数量: 444
  • 博客积分: 10593
  • 博客等级: 上将
  • 技术积分: 3852
  • 用 户 组: 普通用户
  • 注册时间: 2006-05-09 15:26
文章分类

全部博文(444)

文章存档

2014年(1)

2013年(10)

2012年(18)

2011年(35)

2010年(125)

2009年(108)

2008年(52)

2007年(72)

2006年(23)

分类:

2010-02-10 08:45:49

V1.1
A.检查7133磁盘阵列连接的SSA环路中每台RS6000小型机的errpt及mail中报错信息,记录报错pdisk及SRN等信息;检查每台小型机报错后,下列步骤在其中一台小型机上完成,如该array在使用的小型机;
B.通过smitty ssaraid命令,进入SSA的专用操作菜单,检查阵列当前array状态,是否有array degraded,是否有hot spare盘被使用;
C.检查报错的硬盘所在array对应hdisk,确定所在array raid类型;
D.lspv检查确定有硬盘故障hdisk所在vg,lsvg –l *vg检查当前vg内lv是否都是syncd;
E.根据阵列状态及报错确定故障pdisk后,lscfg –vl pdisk*检查该pdisk VPD信息,确认FRU,SN等信息供IBM工程师订新备件;
F.如果该array中故障pdisk已经failed,则直接跳到H;如果该array中报错的pdisk仍在使用,则进行下一步;
G.通过smitty ssaraid命令进入菜单,选择
Change Member Disks in an SSA RAID Array
Remove a Disk From an SSA RAID Array
从array中移除报错的pdisk,这时array状态会变成degreded;
H.通过diag命令进入菜单,选择
Task selection->SSA->set service mode
选中报错的pdisk并设置service mode;
I.根据7133存储上亮起的黄色指示灯确认故障硬盘位置,平稳拔出硬盘,等待5s,平稳插入新硬盘;
J.在该7133 SSA Link中每台IBM小型机上,执行rmdev –dl pdisk*删除故障pdisk信息(注意每台小型机上pdisk并不一至),并cfgmgr重认设备,检查发现新硬盘,lscfg –vl pdisk*检查新硬盘信息正常;
K.通过smitty ssaraid菜单,选择
Change/Show Use of an SSA Physical Disk
若hot spare在使用中则将新pdisk设置成hot spare,跳到步骤M; 若无hot spare则将新pdisk设置成array candidate,继续下一步;
L.在array无hot spare情况下,这时需要将新pdisk加入degraded状态的array,在SSA菜单中选择
Change Member Disks in an SSA RAID Array
Swap Members of an SSA RAID Array
菜单中分别选择:故障所在array,被剔出pdisk留下的blank信息,新pdisk;执行后新pdisk就加入该array并开始同步阵列;
M.同步开始后, 重新在SSA菜单中检查SSA Link中每台IBM小型机以下内容
List All Defined SSA RAID Arrays
List Status Of All Defined SSA RAID Arrays
确认array rebuilding状态,及完成进度;
N.重新检查每台小型机errpt,mail及diag中ssa link status等无异常,其中errpt中有更换磁盘时的ssa open link等报错属正常现象;
O.耐心等待array同步完成显示good状态,所有工作完成.
V1.1
这个版本主要添加了更换没有做raid 的7133的disk的步骤。
A,检查7133磁盘阵列连接的SSA环路中每台RS6000小型机的errpt及mail中报错信息,记录报错pdisk及SRN等信息;检查每台小型机报错后,下列步骤在其中一台小型机上完成,如该array在使用的小型机;
B,通过smitty ssaraid命令,进入SSA的专用操作菜单,检查阵列当前array状态,在list all defined array里面,你会发现没有任何定义的array;
C,此时就可以判断此7133没有做raid;
D,从errpt里面,确定报错的pdiskX的号,输入命令ssaxlate –l pdiskX, 确定此pdiskX对应的那个逻辑盘,输出应为hdiskY;
E,查看此lspv –l hdiskY来查看此hdiskY内所有的lv,并用命令lv –m lvname来确定这些lv是否在其他逻辑盘上有copy份;
F,比如hdiskZ与hdiskY做镜像,就需要用命令smitty rmlvcopy ,只保留hdiskZ那份所有的lv,通过lspv –l hdiskX确定没有任何lv在里面;
G,Smitty reducevg,将hdiskY从vg从踢出来;
H,进入diag,置那块pdiskX为service mode;
I,物理更换7133的硬盘。
J,主机输入命令cfgmgr 识别新的物理盘,会发现系统多出一块系统盘pdiskN,而原有的pdiskX还在;
K,此时用命令rmdev –dl hdiskY ,rmdev –dl pdiskX, rmdev –dl pdiskN,删除pdiskX以及新的pdiskN在系统里面的定义,重新cfgmgr,恢复原有的状态;
L,将新的hdiskY重新加入vg中,并做smitty mklvcopy,将hdiskZ中的lv拷贝到hdiskY中,保证hdiskY与hdiskZ恢复原有mirror关系;
M,确认lsvg –l rootvg,确认所有lv都是sync的,没有stale的lv。
N,签service log,收拾回office,关call。

阅读(3723) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~