Chinaunix首页 | 论坛 | 博客
  • 博客访问: 177000
  • 博文数量: 28
  • 博客积分: 430
  • 博客等级: 下士
  • 技术积分: 257
  • 用 户 组: 普通用户
  • 注册时间: 2011-12-30 09:53
文章分类

全部博文(28)

文章存档

2012年(27)

2011年(1)

分类:

2012-05-15 15:43:28

个监测inux/Unix系统cpu、电源及主板温度的Nagios plugins
最新版本见8楼
移植在HP系统,通过snmp获取温度数据的脚本,见16楼 bladezxf 的帖子
http://www.itnms.net/discuz/viewthread.php?tid=612&extra=pageD7&page=1

--温度数据的获取,利用xmbmon或者lm-sensors

前两天,有台Linuxserver在idc宕掉了(一个内部测试系统,所有一直也没有关注)。后来查询日志才发现是系统温度过高导致的。syslog中发现有cpu 温度过高的告警信息。应该是风扇挂掉造成的。
为了避免类似的问题再次出现,写了一个Nagios的plugins,专门用来监测Linux server cpu,电源及主板的温度。用xmbmon或者lm-sensors来采集温度数据。

因为mbmon及sensors命令都需要root的permission。因此nagios如果要正常运行此命令,就需要配置sudoer。
如果觉得sudoer的配置太复杂的话,可以把这两个命令加上suid,这样简单一些。(如果是生产系统,建议使用sudoer的方式,这样更安全一点。)


系统的使用大致如下:
[root@mailserver libexec]# ./check_sys_temperature.sh -m mbmon -w 40,55,60
阅读(2279) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~