昨天为一台装有RHEL5.3的机器加了4条单条为8G的内存,重启后出现如下信息:
1、Memory for crash kernel notwithin permissible range
2、Alert! Single-bit memory error previously detected in DIMM3 or 4
问题1用下述方法解决(也可在kdump图形界面下操作):
vi /etc/grub.conf,在内核行尾添加
如:
kernel /vmlinuz-2.6.18-164.el5 ro root=LABEL=/1 rhgb quiet
重启系统,查看kdump服务状态:
wx02{owr5000}% service kdump status
Kdump is operational
说明kdump已启用了。以后重启系统就不出现问题1的信息了。kdump是一种内核崩溃转储机制,通常为系统分析师debug用,一般用户可以不予理会。
相关内容可参见:
Collecting and analyzing Linux kernel crashes - Kdump
问题2的处理:开始无论更换插槽位置还是内存条,当增加到3条时,就提示single-bit error,于是进入BIOS,禁用相应log信息提示,即启动系统时跳过手动确认这步,让系统正常启动起来。这只是权益之计。在较老的机器上加4条单条为8G的内存,由于硬件、软件及使用环境之间的不一致性,常常会导致一些“软”错误。至于系统是否能稳定运行,有待使用一段时间来验证。注:在原来未占用插槽上更换内存条时,由于插槽年久氧化,是不认内存条的主要原因。
这是添加后的内存信息:
wx02{owr5000}% free
total used free shared buffers cached
Mem: 32830544 840744 31989800 0 36888 385336
-/+ buffers/cache: 418520 32412024
Swap: 33551712 0 33551712
wx02{owr5000}%
相关内容可参见:
A Memory Soft Error Measurement on Production Systems
==================
经一段时间使用后,发现内存频繁出现报错信息,即内存不稳。当去掉两条后才稳定下来。看来故障是因插槽年久氧化所导致的。
阅读(15769) | 评论(0) | 转发(0) |