Chinaunix首页 | 论坛 | 博客
  • 博客访问: 3131110
  • 博文数量: 144
  • 博客积分: 10056
  • 博客等级: 上将
  • 技术积分: 2603
  • 用 户 组: 普通用户
  • 注册时间: 2006-12-13 14:20
个人简介

互通有无,共同提高。

文章分类

全部博文(144)

分类: LINUX

2011-11-25 11:49:40

昨天为一台装有RHEL5.3的机器加了4条单条为8G的内存,重启后出现如下信息:
 
1、Memory for crash kernel notwithin permissible range
2、Alert! Single-bit memory error previously detected in DIMM3 or 4
 
问题1用下述方法解决(也可在kdump图形界面下操作):
 
vi /etc/grub.conf,在内核行尾添加
 
如:
kernel /vmlinuz-2.6.18-164.el5 ro root=LABEL=/1 rhgb quiet
 
重启系统,查看kdump服务状态:
wx02{owr5000}% service kdump status
Kdump is operational
 
说明kdump已启用了。以后重启系统就不出现问题1的信息了。kdump是一种内核崩溃转储机制,通常为系统分析师debug用,一般用户可以不予理会。
 
相关内容可参见:
Collecting and analyzing Linux kernel crashes - Kdump

 
问题2的处理:开始无论更换插槽位置还是内存条,当增加到3条时,就提示single-bit error,于是进入BIOS,禁用相应log信息提示,即启动系统时跳过手动确认这步,让系统正常启动起来。这只是权益之计。在较老的机器上加4条单条为8G的内存,由于硬件、软件及使用环境之间的不一致性,常常会导致一些“软”错误。至于系统是否能稳定运行,有待使用一段时间来验证。注:在原来未占用插槽上更换内存条时,由于插槽年久氧化,是不认内存条的主要原因。
 
这是添加后的内存信息:
wx02{owr5000}% free
             total       used       free     shared    buffers     cached
Mem:      32830544     840744   31989800          0      36888     385336
-/+ buffers/cache:     418520   32412024
Swap:     33551712          0   33551712
wx02{owr5000}%
 
相关内容可参见:
A Memory Soft Error Measurement on Production Systems
 
==================
经一段时间使用后,发现内存频繁出现报错信息,即内存不稳。当去掉两条后才稳定下来。看来故障是因插槽年久氧化所导致的。
阅读(15749) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~