Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1250384
  • 博文数量: 125
  • 博客积分: 4372
  • 博客等级: 上校
  • 技术积分: 1055
  • 用 户 组: 普通用户
  • 注册时间: 2006-10-12 09:53
文章分类

全部博文(125)

文章存档

2019年(3)

2018年(2)

2017年(1)

2016年(2)

2015年(4)

2014年(11)

2013年(5)

2012年(4)

2011年(12)

2010年(10)

2009年(17)

2008年(17)

2007年(25)

2006年(12)

分类:

2007-04-25 17:14:13

7133RAID报错问题
前一段时间客户一台P630问题的处理过程,仅供参考.
说一下环境:
2台P630+1台7133
AIX5.1,HA4.5 
其中一台报错如下:
# errpt
标识符     时间戳记   T C 资源名         描述
B4C00618   0404140007 P H ssa0           资源不可用
B4C00618   0404130007 P H ssa0           资源不可用
B4C00618   0404120007 P H ssa0           资源不可用
B4C00618   0404110007 P H ssa0           资源不可用
B4C00618   0404100007 P H ssa0           资源不可用
B4C00618   0404090007 P H ssa0           资源不可用
B4C00618   0404080007 P H ssa0           资源不可用
B4C00618   0404070007 P H ssa0           资源不可用
B4C00618   0404060007 P H ssa0           资源不可用
AA8AB241   0404050107 T O OPERATOR       操作员通知
21F54B38   0402050307 P H pdisk4         磁盘操作错误
FE9E9357   0402050207 P H pdisk4         磁盘操作错误
613E5F38   0331030507 P H LVDD           LVM 检测到 I/O 错误
# errpt -a | pg
---------------------------------------------------------------------------
标签:          SSA_ARRAY_ERROR
标识符:        B4C00618

日期/时间:      公元2007年04月04日  星期
泻牛?          2799
机器 Id:        005D077A4C00
节点 Id:        mail
类:             H
类型:           PERM
资源名:         ssa0            
资源类:         adapter
资源类型:       ssa160
位置:           1V-08
VPD:            
        Part Number................. 09L5695
        FRU Number.................. 34L5388
        Serial Number...............S3192035
        EC Level....................    E27782
        Manufacturer................IBM053
        ROS Level and ID............A400    0000
        Loadable Microcode Level....05
        Device Driver Level.........00
        Displayable Message.........SSA-ADAPTER 
        Device Specific.(Z0)........SDRAM=128 
        Device Specific.(Z1)........CACHE=32
        Device Specific.(Z2)........UID=006094C10000F304

说明
资源不可用

可能原
DASD 设备

失败原
磁盘驱动器

        推荐的操作
        执行问题确定过程

详细数据
检测数据
0475 0001 4635 4141 3346 3639 3745 4231 3443 4B00 C970 6E06 3700 0000 0100 0500 
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 
---------------------------------------------------------------------------
标签:          SSA_ARRAY_ERROR
标识符:        B4C00618

日期/时间:      公元2007年04月04日  星期
泻牛?          2798
机器 Id:        005D077A4C00
节点 Id:        mail
类:             H
类型:           PERM
资源名:         ssa0            
资源类:         adapter
资源类型:       ssa160
位置:           1V-08
VPD:            
        Part Number................. 09L5695
        FRU Number.................. 34L5388
        Serial Number...............S3192035
        EC Level....................    E27782
        Manufacturer................IBM053
        ROS Level and ID............A400    0000
        Loadable Microcode Level....05
        Device Driver Level.........00
        Displayable Message.........SSA-ADAPTER 
        Device Specific.(Z0)........SDRAM=128 
        Device Specific.(Z1)........CACHE=32
        Device Specific.(Z2)........UID=006094C10000F304

说明
资源不可用

可能原
DASD 设备

失败原
磁盘驱动器

        推荐的操作
        执行问题确定过程

详细数据
检测数据
0475 0001 4635 4141 3346 3639 3745 4231 3443 4B00 C970 6E06 3700 0000 0100 0500 
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 
----------------------------------------------------------
# ssaraid -Izl ssa0
pdisk0          0040AA82C95A00D member      n/a         36.4GB  Physical disk
pdisk1          0040AA83B60400D member      n/a         36.4GB  Physical disk
pdisk2          0040AA83B63300D member      n/a         36.4GB  Physical disk
pdisk4          0040AABB258500D member      n/a         36.4GB  Physical disk
pdisk3          0040AABB8D0B00D member      n/a         36.4GB  Physical disk
pdisk5          0040AABCA7AB00D member      n/a         36.4GB  Physical disk
pdisk6          00B006C2B64C00D member      n/a         36.4GB  Physical disk
hdisk3          F5AA3F697EB14CK good                    72.9GB  RAID-5 array
hdisk2          F5AA42D7E10F4CK good                    109.3GB RAID-5 array
但是用smit ssaraid
->List Status Of All Defined SSA RAID Arrays
->raid_5      

                                                              命令状态

                Unsynced Parity Strips   Unbuilt Data Strips
hdisk2                   0                       0
hdisk3                   0                       0           Invalid data strip
看到此RAID有Invalid data strip的错误,而正常情况下不应该有这个错误标识的,正因为此,所以系统才每隔1小时报一次错.这个错误说明此RAID中有坏的data strip(如同硬盘有坏的扇区一样),鉴于日志中有关pdisk4的报错,所以先换掉pdisk4硬盘,同步之后此RAID的状态结果依然是Invalid data strip,所以只能删除后重新建立此RAID了,明确了这一点,解决起来就比较容易了,备份好数据,删除RAID,验证组成此RAID的3块硬盘,重新建立此RAID,新建卷组和文件系统,恢复数据,然后同步HA就可以了.
注意:1 一定做好数据备份,我这次做备份就花了很长时间.
     2 记录卷组等相关信息以便未来重新建立此卷组时参考.
     3 可以备份卷组,重建RAID后只需要恢复卷组即可.


阅读(4524) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~