有一段时间没有出差了,今天到客户那里去拆卸HP N4000机器上的2G内存,遇到点小麻烦,记录下来,防止下次再犯同样的错误。
12点的时候,客户那边停应用、数据库,ps -ef | grep oracle确信数据库已经停下来。shutdown -hy 0停机、下电(停机之前dmesg查看机器上有6G内存容量)。揭开机器顶盖,观察发现6G的内存平均分配在两块内存板上(每块内存板上6条512M内存,N4000跟L2000在内存放置位置方面不同之处在于,L2000所有内存插槽直接分配在主板上,而N4000上有两个用于内存的插槽,每个插槽用来放置一个内存板,每块内存板上有八个插槽)。我所做的操作是将其中一块内存板给拔出来,取出1A、1B、2A、2B位置上的四条512M内存、插入内存板、合上机器顶盖、上电、开机。
自检的时候机器报内存错,客户提醒一句:是不是两块内存板上必须保持平衡的内存配置?比如说一块内存板上有四条512M内存,那另一块内存板上也必须保持相同的配置。深以为然,于是在GSP中关机,下电。按照同样的步骤拔出两块内存板,将有3G内存的内存板上拔出2块512M内存条插入到1G容量内存板上,这样两块内存板上都有2G容量内存。
插入内存板、合上机器顶盖、加电、开机,观察机器自检过程,顺利通过。看来客户说得没错,两块内存板必须保持平衡的配置,否则机器自检的时候就会报错。在公司做实验的时候只有一块内存板,所以没有注意这个问题,通过这次现场操作充分吸取教训,经验值上升两点,值得庆贺。
总结:在做现场维护的时候,可能会因为紧张而变得疏忽大意,忽略了一些细节,从而导致整个过程的失败。不能因为需要完成的工作简单就轻视,有时候正是因为这样的心态从而酿成大祸。
阅读(1908) | 评论(0) | 转发(0) |