环境:ibm x346服务器,安装redhat-as4-u2 32bit操作系统
问题起因:2月8号早上突然发现系统无法远程ssh登陆,打电话给托管机房,让其重启,重启后大概二十分钟,系统又再次宕机,于是赶到托管机房检查原因。经检查,服务器磁盘绿灯亮,状态良好,服务器无报警灯亮,在系统启动时候通过ctrl+A进入ibm raid管理界面,发现有一块硬盘处于degraded状态,另一块optimal状态,查询optimal属于正常状态,degraded属于磁盘降级状态,需要raid1 的重建。之后又重启,把宕机硬盘拔下在插上,装态变为了replace,找到原因所在,当时想到的解决方案有两个:
第一、是准备一块新的硬盘,必须同现有的生产硬盘一模一样,替换到degraded的硬盘,重启开机,raid1会在线的实施同步,耗费时间比较长,而且影响系统的性能
第二、重启开机ctrl+A进入raid管理,手动的进行rebuild。
因为机房距离公司比较远,当时想的是现场解决问题不在麻烦跑一回,就选择了第二种方法,可是让我预想不到的是rebuild功能非常耗时,下午五点开始进行rebuild,到晚上十二点半才结束,我的硬盘是73Gscsi,时候查询资料,rebuild的确是耗时,大概计算为10G容量需要一个小时左右。
相关资料:
描述:
使用 SIMATIC PC 时,如果 RAID1 硬盘系统报告 "degraded",说明硬盘在 RAID1 数组发生错误。然而,这并不意味着数据已经丢失。PC 将继续自动运行片刻,并与硬盘交互(RAID1功能)。但是,此刻不再有硬盘的冗余。PC 机能够运行到下一个合适的维护日期。
原因:
产生 "degraded" 消息可能有以下原因:
- 硬盘有缺陷(硬盘错误,对于此消息的典型的原因)
- 即使硬盘没有缺陷(非常例外),作为 RAID1 驱动器的 "Bad Block Recovery Handling" 的一部分,也会出现此消息。
当 PC 机遭遇硬切断的时候,能够发生“坏块”(也被称作不可恢复的 CRC 故障),例如,在写入磁盘的过程中,发生突然的电源故障。如果在从磁盘读取的过程中发现“坏块”,相关块从 RAID1 数组的其他硬盘读取,并且“坏块”被纠正。这个过程叫做“坏块恢复”。
在某一条件下,存储管理器不能正确地运行“坏块恢复”程序。这将导致 RAID1 数组报告 "degraded"。如果发生机械的硬盘错误时,你一定要替换相应的硬盘驱动器。
注意:
替换 RAID1 数组的硬盘驱动器的过程在相关设备的操作指令中给出。
阅读(4562) | 评论(0) | 转发(0) |