个监测inux/Unix系统cpu、电源及主板温度的Nagios plugins
最新版本见8楼移植在HP系统,通过snmp获取温度数据的脚本,见16楼 bladezxf 的帖子
http://www.itnms.net/discuz/viewthread.php?tid=612&extra=pageD7&page=1
--温度数据的获取,利用xmbmon或者lm-sensors
前两天,有台Linuxserver在idc宕掉了(一个内部测试系统,所有一直也没有关注)。后来查询日志才发现是系统温度过高导致的。syslog中发现有cpu 温度过高的告警信息。应该是风扇挂掉造成的。
为了避免类似的问题再次出现,写了一个Nagios的plugins,专门用来监测Linux server cpu,电源及主板的温度。用xmbmon或者lm-sensors来采集温度数据。
因为mbmon及sensors命令都需要root的permission。因此nagios如果要正常运行此命令,就需要配置sudoer。
如果觉得sudoer的配置太复杂的话,可以把这两个命令加上suid,这样简单一些。(如果是生产系统,建议使用sudoer的方式,这样更安全一点。)
系统的使用大致如下:
[root@mailserver libexec]# ./check_sys_temperature.sh -m mbmon -w 40,55,60
阅读(2316) | 评论(0) | 转发(0) |