分类:
2008-10-15 16:24:50
最近在一个新安装的Freebsd 7系统部署一套nagios监控系统,主要用来监控主机的存活状态、网络服务的状态以及远程主机的资源利用情况。尽管Freebsd安装源码有些麻烦,但最终还是把nagios正确安装上了,并且能正常工作,通过web方式也能看见监控对象的状况。
有故障报警行为,但看不到?
如上图所示,真有一个的443端口对应的服务发生故障了,可是等了半天就是收不到报警邮件。登录nagios所在的系统,检查与邮件发送相关的情况,其基本操作是:检查sendmail是否起来(ps aux | grep sendmail),结果正常;用mail程序手动发一封邮件给我的一个邮箱(mail –s “This is a mail test project” < ip_scan ),能发送和接收到这封邮件。问题在哪里呢?
由上面的排查,基本可以断定sendmail没什么问题,域名解析也是正常的(专门为这个监控解析MX及A记录),现在可能的原因只能在nagios这边了。进入nagios配置文件所在的目录,挨个察看配置文件。我的nagios配置目录的情况如下:
[root@nagios /usr/local/nagios]# pwd
/usr/local/nagios/etc
[root@nagios /usr/local/nagios/etc]# ls *.cfg
cgi.cfg contacts.cfg localhost.cfg services.cfg
commands.cfg hostgroups.cfg nagios.cfg timeperiods.cfg
contactgroups.cfg hosts.cfg resource.cfg没看见有什么异常的情况,改了其中的某些设置,如cgi.cfg文件,重启nagios,还是不能发报警邮件。可是,但我点击web管理界面的时候,确实是有邮件报警行为,如下图所示:
既有主机故障通知,又有服务故障报警通知,而且都应该按我的定义发送邮件的呀!
[1]