昨天接到客户的电话,说一台SUN E3500宕机,重启不能进入到系统。到达现场之后看到系统停留在控制台也就是ok模式下,无论boot启动、boot -s进入单用户,抑或是boot cdrom通过光驱引导都不成功。情急之下只能断电先,等待几分钟后加电引导,自检通过,到达ok模式下,报了一个错:
Clock board TOD does not match TOD on any IO board.
按照提示,应该是时钟板和IO板不匹配的问题。第一次处理SUN方面的故障,所以根据错误提示认定是时钟板的问题,但通过观察E3500背板,时钟板状态正常,故障灯未亮,电源灯以及运行灯都显示绿色,说明问题还不太严重。
基于这个判断,自做主张的给用户更换了时钟板,但居然连系统都启不来了,错误信息如下:
Invalid wwn number 21000020 374fcbb8
断电之后,查了一下E3500的服务手册,在介绍时钟板部分提到一句非常重要的话:
Note – If you are replacing the clock+ board, the TOD NVRAM from the old
board must be removed and placed on the new board. Note also that if a system
is replaced, then the TOD NVRAM on the clock+ board must also be changed.
根据字面意思理解,就是说在更换时钟板的时候一定注意要将原来的NVRAM给替换到新加的时钟板上,否则就白换。观察了时钟板上的NVRAM,一块麻将1/2般大小,用手拔了拔,没用,拔不下来,死死的固定在板子上。咨询了一下专家有关更换时钟板的注意事项,专家说这个东西要拿镊子给撬起来,否则就只有使劲拔。没有镊子,但又害怕给拔坏了,所以放弃了这样的操作。
之后采取了一种行之有效的办法,那就是在ok模式下敲一个命令"copy-clock-tod-to-io-boards",这样做的目的就是将时钟板上的信息同步到IO板上,除此之外还有一个命令"copy-io-board-tod-to-clock-tod",目的都是一样的。这样做了之后再断电重启,进入到ok模式之前果然就没有之前的报错信息了。但之前客户提到的不能启动系统实际与另一个问题相关,欲知后事如何,且听下回分解。
阅读(2966) | 评论(2) | 转发(0) |