670DWON机.已经检查确定是CPU和L3CACHE故障.备件还在路上走..突然又接到报障电话,称S85 DOWN机,且没有代码...迅速起床赶去现场,机器已经下电了.LED没任何显示.应用已经被备机接管.启动机器,似呼正常,进入系统后进行全面的诊断检测..结果出来了.什么代码抄下来,查了下手册,I/O板的温度过高......机房管理员称机房温度都控制的蛮标准.在机器的进出风口处温度都还好.曾经几年前也遇到过此类报错,死过机一次.但上次是哪个公司保的机器就不知道.当时还挂了个温度计在机器旁边测试过温度都没问题.当时人家见机器启来了就没继续跟吧.这下问题就又出现了.....
环境问题排除了那就只有是机器内部的问题...于是再仔细查看了下I/O板的温度感应器...发现其中两个感应器的温度都是20度,另一个是3度....问题找到了.就是这第三个温度感应器有问题.于是问题也来了.这感应器也是也I/O板一起的啊..没办单独更换..只得更换整个I/O板了..
问题的原因找到了就好办了.准备更换I/O板.马上联系了备件库调备件.
天亮了后,备件到了,准备晚上动手更换.
环境还有点复杂.各种卡,线较多.先打好标,防静电手环等工作都做好了.开始拆后盖,很简单.再按顺序把卡拆下来..里面还有好多电源线,SCSI线.都做好标再拆...很快就拆完了.I/O板也取下来了.换上新的I/O板.把卡都还原到原卡位,很顺利完成.
检查一遍没问题了.准备上电启机了..
一切正常.机器启来了.进入系统再检测下温度感应器.OK.正常了.三个感应器的温度都是20度了.把应用再移动主机.正常.
阅读(1144) | 评论(0) | 转发(0) |