2012年(5)
分类: 系统运维
2012-07-19 14:23:51
AIX镜像克隆操作手册
2012-5-10 版本号:V1.0
目 录
1. 引言..................................................................................................................... 2
2. AIX镜像步骤........................................................................................................ 2
2.1 将空闲磁盘加入rootvg,( extendvg)............................................................. 2
2.2 去掉rootvg的QUORUM属性 (chvg –Qn)................................................ 4
2.3 镜像ROOTVG (mirrorvg –s)....................................................................... 5
2.4 镜像间的数据同步 (syncvg -v)..................................................................... 6
2.5 在rootvg的两块盘上创建引导信息............................................................... 6
2.6 更新引导设备顺序,实现单机bos容错 (bootlist).......................................... 6
2.7 重新系统 (shutdown –Fr)......................................................................... 7
2.8 引导过程检查,确认无误............................................................................. 7
2.9 检查镜像是否成功....................................................................................... 7
3. AIX镜像移除........................................................................................................ 8
3.1 把rootvg的mirror去掉................................................................................ 8
3.2 去掉hdisk1的引导信息................................................................................ 8
3.3 从rootvg中删除hdisk1................................................................................. 8
3.4 删除硬件设备(加-R表示强制删除)............................................................... 8
3.5 更新引导设备顺序....................................................................................... 8
4. AIX克隆步骤........................................................................................................ 9
4.1 系统检查..................................................................................................... 9
4.2 克隆rootvg.................................................................................................. 9
4.3 升级操作.................................................................................................... 10
4.4 删除/使用克隆盘........................................................................................ 10
如果你的AIX系统rootvg仅有一块硬盘,当灾难来临的时候,例如硬盘损坏,这就意味着你的系统就再也不能启动了。尽管你可能拥有mksysb的磁带,但你仍然需要花费很多的时间去处理这个原本很小的问题。rootvg镜像能够提供单机bos容错,使得你能够用最短的时间摆脱这种困境,简单到只需要一次重新启动,这就是rootvg镜像的作用。
一般情况下在生产环境中,我门的rootvg大多数是mirror,如果ML升级失败或者一些错误操作,导致无法恢复等,这是就需要我门迅速恢复rootvg,无论是使用磁带mksysb 恢复,还是网络引导恢复,这个速度各方面都不理想。使用alt_disk_copy恢复rootvg时间最快,同样简单到只需一次重新启动,这就是克隆的作用。
制作rootvg的标准步骤大致如下
1. extendvg
2. chvg –Qn
3. mirrorvg –s
4. syncvg –v
5. bosboot –a
6. bootlist
7. shutdown –Fr
8. bootinfo –b
(1)查看当前还未加入到其它vg的可用PV;
# lspv
hdisk0 00027c6a0507fe17 rootvg active
hdisk1 none None
此结果表明hdisk1当前未在任何vg,可以作为镜像的磁盘
同时表明目前rootvg仅有一块磁盘hdisk0
#prtconf |grep disk 查看大小是否一致
hdisk0 active 546 376 109..49..00..109..109
+ hdisk0 U787B.001.DNW5942-P1-T14-L5-L0 16 Bit LVD SCSI Disk Drive (146800 MB)
+ hdisk1 U787B.001.DNW5942-P1-T14-L8-L0 16 Bit LVD SCSI Disk Drive (146800 MB)
注:如未发现新硬件,执行下面命令进行扫描设备
#cfgmgr -v
发现新硬件后,这是我们要看下物理卷的属性。
# lsdev -Cc disk
hdisk0 Available 09-08-00-5,0 16 Bit LVD SCSI Disk Drive
hdisk1 Available 09-08-00-8,0 16 Bit LVD SCSI Disk Drive
(2)查看hdisk1是否是AIX支持的引导设备
# bootinfo -B hdisk1
1
返回1,说明磁盘可以作为引导设备,其它值说明此盘不是候选
(3)激活hdisk1,给其盘赋值一个pvid,如PVID(00027c6acda7df21)已存在则无需执行该步骤
# chdev -l hdisk1 -a pv=yes
hdisk1 changed
# lspv
hdisk0 00027c6a0507fe17 rootvg active
hdisk1 00027c6acda7df21 None
在候选盘hdisk1做镜像前,需要被赋值一个PVID,否则无法被加入到rootvg
--如果没有在赋值pvid前执行扩展vg会报如下错误
# extendvg rootvg hdisk1
0516-1254 extendvg: Changing the PVID in the ODM.
提示:需要在ODM库里改变PVID
(4)扩展rootvg
# extendvg rootvg hdisk1 如执行失败则表示hdisk1可能有数据可使用-f参数强行扩展即执行:(# extendvg –f rootvg hdisk1),注:该步骤将删除hdisk1的所有数据。
# lspv
hdisk0 00027c6a0507fe17 rootvg active
hdisk1 00027c6acda7df21 rootvg active
执行rootvg的扩展后,查看结果为hdisk1已经被加入到了rootvg
同时表明要想做为镜像的磁盘必须和目标vg在同一个vg;不可能用vg2中的一块盘
来做rootvg的镜像磁盘(至少在目前有这个限制)
所谓Quorum,此处的Quorum可以理解为是vg的一个属性,vg能否被激活根据此属性的值决定的。此属性的取值又是根据vg内所含磁盘的VGDA决定。大意就是如果某个磁盘有问题,此盘上的VGDA就视为有问题(异常盘);当vg里所含的盘有超过半数都异常时,系统就会自动把此vg给varyoff,当然此vg也就无法被访问了。要想对QUORUM有更深入的理解,还是请参考redbook自己去理解吧。
# chvg -Qn rootvg
0516-1804 chvg: The quorum change takes effect immediately.
# lsvg rootvg
# lsvg rootvg
VOLUME GROUP: rootvg VG IDENTIFIER: 00c36e6a00004c000000013667dc8e3a
VG STATE: active PP SIZE: 256 megabyte(s)
VG PERMISSION: read/write TOTAL PPs: 546 (139776 megabytes)
MAX LVs: 256 FREE PPs: 376 (96256 megabytes)
LVs: 13 USED PPs: 170 (43520 megabytes)
OPEN LVs: 12 QUORUM: 1 (Disable)
TOTAL PVs: 1 VG DESCRIPTORS: 2
STALE PVs: 0 STALE PPs: 0
ACTIVE PVs: 1 AUTO ON: yes
MAX PPs per VG: 32512
MAX PPs per PV: 1016 MAX PVs: 32
LTG size (Dynamic): 256 kilobyte(s) AUTO SYNC: no
HOT SPARE: no BB POLICY: relocatable
PV RESTRICTION: none
去掉QUORUM后,查看vg可以看到下面的行
QUORUM: 1
说明修改已经完成,在只有2个盘的镜像rootvg中,此值应该一致保持为1,即使镜像完成后也不要再修改为2,否则就失去rootvg的镜像作用了。
专业点的说法:此情况称之为简单镜像(single mirroring),一般单镜像的卷组都需要将quorum关闭,否则卷组中拥有2份VGDA的磁盘不可用时,受quorum制约,整个卷组无法激活,从而失去镜像意义。 对于rootvg镜像更加需要关闭quorum,否则一旦包含2份VGDA的磁盘不可用时,系统在引导过程中将不能激活rootvg,从而引起启动失败。 该命令可在系统正常运行时随时补充执行,但需要重新启动才能生效。 如果始终没有执行过,当系统启动失败时,可以使用可引导介质进入维护模式,激活rootvg,获得shell时再执行此命令,然后正常启动即可。
当rootvg包含了2块盘后,也就具备了镜像的最小条件了,这步就可以执行实际的镜像操作了,建立rootvg所有lv的镜像有2种方式,你可以使用mklvcopy一个一个去建立,当然更加简单的方法是使用卷组镜像命令。
# (-s 参数指定不同步vg ,–S参数指定后台同步vg)
#mirrorvg -c 3 rootvg hdisk1,hdisk2 (-c指定镜像数及硬盘,2块硬盘无需指定)
或者
# mklvcopy hd1 2 hdisk1
# mklvcopy hd2 2 hdisk1
# mklvcopy hd3 2 hdisk1
# mklvcopy hd4 2 hdisk1
# mklvcopy hd5 2 hdisk1
# mklvcopy hd6 2 hdisk1
# mklvcopy hd8 2 hdisk1
# mklvcopy hd9var 2 hdisk1
# mklvcopy hd10opt 2 hdisk1
当镜像完成后,会在屏幕上收到如下信息,表明镜像步骤完成
# 0516-1126 mirrorvg: rootvg successfully mirrored, user should perform
bosboot of system to initialize boot records. Then, user must modify
bootlist to include: hdisk0 hdisk1.
#syncvg -v rootvg
(1) 创建引导信息
#bosboot –a 因为hd5已经做了镜像,因此在执行该命令时无需使用-d选项指定磁盘,除非当在其他情况,如迁移hd5至其他磁盘时。
或
# bosboot -ad hdisk0
# bosboot -ad hdisk1
(2)查看引导信息
# lslv -l hd5
hd5:N/A
PV COPIES IN BAND DISTRIBUTION
hdisk0 001:000:000 100% 001:000:000:000:000
hdisk1 001:000:000 100% 001:000:000:000:000
(1) 设置引导顺序
#bootlist -m normal hdisk0 hdisk1 cd0
(2)验证引导顺序
# bootlist -m normal -o
hdisk0 blv=hd5 pathid=0
hdisk1 blv=hd5 pathid=0
cd0
此例表示在正常情况下,系统从hdisk0进行引导,当hdisk0不可用时将从hdisk1进行引导,以提供单机容错。
#shutdown –Fr 因quorum关闭的操作必须重启操作系统生效(注:实践中本人未重启过)
# bootinfo -b
hdisk0
#
rootvg:
LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINT
hd5 boot 1 2 2 closed/syncd N/A
hd6 paging 32 64 2 open/syncd N/A
hd8 jfs2log 1 2 2 open/syncd N/A
hd4 jfs2 16 32 2 open/syncd /
hd2 jfs2 16 32 2 open/syncd /usr
hd9var jfs2 8 16 2 open/syncd /var
hd3 jfs2 8 16 2 open/syncd /tmp
hd1 jfs2 40 80 2 open/syncd /home
hd10opt jfs2 20 40 2 open/syncd /opt
hd11admin jfs2 8 16 2 open/syncd /admin
fwdump jfs2 8 16 2 open/syncd /var/adm/ras/platform
lg_dumplv sysdump 4 4 1 open/syncd N/A
livedump jfs2 8 16 2 open/syncd /var/adm/ras/livedump
说明:LP*2=PP 表示一份镜像,LP=PP表示没做镜像,LP*3=PP表示有二份镜像。LP*2=PP,是指一份LP的数据,对应两份PP的数据,物理上是有2份拷贝的
# unmirrorvg rootvg hdisk1
0516-1246 rmlvcopy: If hd5 is the boot logical volume, please run 'chpv -c
as root user to clear the boot record and avoid a potential boot
off an old boot image that may reside on the disk from which this
logical volume is moved/removed.
0516-1804 chvg: The quorum change takes effect immediately.
0516-1144 unmirrorvg: rootvg successfully unmirrored, user should perform
bosboot of system to reinitialize boot records. Then, user must modify
bootlist to just include: hdisk0.
#chpv -c hdisk1
#reducevg rootvg hdisk1
# chdev -l hdisk1 -a pv=clear 清除PVID
#rmdev -dl hdisk1
hdisk1 deleted
注:如该盘需继续使用无需删除。
. (1) 设置引导顺序
#bootlist -m normal hdisk0 cd0
(2)验证引导顺序
# bootlist -m normal -o
hdisk0 blv=hd5 pathid=0
cd0
(1)检查是否存在镜像
#lsvg –l rootvg 如存在镜像则执行下面操作移除镜像
#unmirrorvg rootvg hdisk1
#reducevg rootvg hdisk1
(2)查看硬盘分布及引导顺序是否正确
#lspv
#bootlist -m normal -o
hdisk0 blv=hd5 pathid=0
(1)克隆rootvg到hdisk1
#alt_disk_copy -d hdisk1 耗时稍长,约
(2)更新引导设备顺序,
#bootlist -m normal -o 查看引导顺序,克隆完成后已改变
Hdisk1blv=hd5 pathid=0
将启动列表改回hdisk0
#bootlist -m normal hdisk0
#bootlist -m normal –o
Hdisk0 blv=hd5 pathid=0
(注意:克隆完成之后,系统启动列表改回原来的设置,因为系统自动把引导设置为hdisk1了)
此时可进行操作系统升级或打补丁操作,如果升级失败只需制作第三方支持所需的快照,然后从原来的rootvg 引导。对于登录的用户来说,没有什么影响。
(1) 如果系统启动没问题。就可以考虑删除克隆盘了。
#alt_rootvg_op -X altinst_rootvg 删除克隆VG
# lsvg 检查删除结果
rootvg
# bootlist -m normal -o 检查引导顺序
hdisk0 blv=hd5 pathid=0
如果不能正常启动,则使用克隆盘,执行以下命令:
#bootlist –m normal –o hdisk1
#bootlist –m normal –o
Hdis1 blv=hd5 pathid=0
#shutdown –Fr
删除原来的rootvg
#lsvg
#alt_rootvg_op –X old_rootvg 删除原来VG
(2) 然后再做mirror,确保系统安全,见“AIX镜像步骤”。