一 故障现象
# oslevel -r
5200-04
# lsvg
rootvg
datavg
#lspv
hdisk0 0054338ee0b6f496 rootvg active
hdisk1 0054338efa398c64 datavg active
# lsvg -l datavg
web:
LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINT
web jfs 100 100 1 open/syncd /ws
loglv00 jfslog 1 1 1 open/syncd N/A
data jfs2 284 284 1 closed/syncd /data
loglv01 jfs2log 1 1 1 closed/syncd N/A
# mount /data
重新播放 /dev/data 的日志。
mount: 0506-324 不能将 /dev/data2 安装到 /data2:媒体未格式化或格式不正确。
0506-342 /dev/data2 的超级块有错误,运行完整的 fsck 以修订。
查看错误日志表明hdisk1损坏.
# errpt
A6DF45AA 0215180108 I O RMCdaemon The daemon is started.
B38E3397 0215175908 U S SYSDUMP 先前的系统转储信息
C0AA5338 0215175808 U S SYSDUMP 系统转储
9D035E4D 0215175108 P S SYSVMM 数据存储中断,处理器
9DBCFDEE 0215175908 T O errdemon 记录错误日志打开
B6DB68E0 0215043408 I O SYSJ2 FILE SYSTEM RECOVERY REQUIRED
49A83216 0215030208 T H hdisk2 磁盘操作错误
6926ECA8 0215030108 I O SYSJ2 META-DATA I/O ERROR
613E5F38 0215030108 P H LVDD LVM 检测到 I/O 错误
425BDD47 0215030108 P H hdisk2 磁盘操作错误
二 解决步骤
由于datavg里有2个文件系统,/ws文件系统可以mount,因此先备份此文件系统数据至安全处,然后按如下步骤进行:
1 运行fsck修复
# fsck /data
****************
当前卷是:/dev/data
**阶段 1 — 检查块、文件/目录和目录条目
fsck:0507-089 读 /dev/rdata 时发生不可恢复的错误。无法继续。
fsck:0507-039 在访问文件系统(1,17360109568,16384,-1)时发生严重错误(-10015,-1)。
fsck:0506-042 执行模块“/sbin/helpers/jfs2/fsck”失败。
# mount /data
重新播放 /dev/data 的日志。
mount: 0506-324 不能将 /dev/data2 安装到 /data2:媒体未格式化或格式不正确。
0506-342 /dev/data2 的超级块有错误,运行完整的 fsck 以修订。
2 超级块修复
If you receive one of the following errors from the fsck or mount commands, the problem may be a corrupted superblock.
fsck: Not an AIX4 file system
fsck: Not an AIXV4 file system
fsck: Not a recognized file system type
0506-342 The superblock is dirty. Run a full fsck to fix.
mount: invalid argument
The backup superblock can be copied over the primary superblock via one of these commands:
dd count=1 bs=4k skip=31 seek=1 if=/dev/lv00 of=/dev/lv00 (JFS)
dd count=1 bs=4k skip=15 seek=8 if=/dev/lv00 of=/dev/lv00 (JFS2) (Version
5 only)
fsck -p /dev/lv00 (works for both JFS and JFS2)
Once the copying over is completed, check the integrity of the file system by issuing:
fsck /dev/lv00
In many cases, copying the backup superblock to the primary superblock will recover the file system. If this does not work, you will have to recreate the file system and restore the data from a backup.
3 Formats a logical volume
# logform /dev/loglv01
logform: destroy /dev/rloglv01 (y)?y
# fsck /data
****************
当前卷是:/dev/data
**阶段 1 — 检查块、文件/目录和目录条目
fsck:0507-089 读 /dev/rdata 时发生不可恢复的错误。无法继续。
fsck:0507-039 在访问文件系统(1,17360109568,16384,-1)时发生严重错误(-10015,-1)。
fsck:0506-042 执行模块“/sbin/helpers/jfs2/fsck”失败。
# mount /data
重新播放 /dev/data 的日志。
mount: 0506-324 不能将 /dev/data2 安装到 /data2:媒体未格式化或格式不正确。
0506-342 /dev/data2 的超级块有错误,运行完整的 fsck 以修订。
4 恢复备份的数据
客户的系统日志里已经表明此datavg的硬盘已经坏了,由以上几步都无法解决问题,因此只能换新盘并重新建立/data文件系统,恢复备份的数据.客户50G的数据大约有3G的无法恢复,只能客户自己再手工恢复了(重新输入数据).如果平时没有做好数据备份那只能哭了,因此一定要做好平时的数据备份.
阅读(10707) | 评论(0) | 转发(0) |