1.建议contacts.cfg区分报警group,member,和不同的报警方式(把template.cfg里的general-contact拷贝到contacts.cfg里)
2.每个项目下建立模板(注意里面的主机,服务定义都要改动,而且去掉general-contact部分),然后define host,define service(还可以建立主机组和服务组,这样页面看起来更直观点),最好每个IP对应一个cfg,也就是每个机器可以把监控项,cpu,memory等添加进去,这样以后扩展起来很方便,而且简洁易懂。
3.最后包含上这些目录和文件,nagios.cfg里。
4.不同时段监控和报警方式意义不大,肯定是7*24小时,重要的message,然后mail了。
注意所有监控需要的命令(包括check_nrpe)都要在commands.cfg定义好,命令要放在/path/libexect/下(这个可以定义)
cgi.cfg定义网页访问用户密码之类
---------------------------------------------
补充一个,当无法处理故障的时候,报警不断,有个more escalation.cfg 可以定义
- define hostescalation{
- first_notification 5
- last_notification 0
- notification_interval 120
- }
- define serviceescalation{
- first_notification 5
- last_notification 0
- notification_interval 120
- }
以上从第5次报警开始到恢复之前,每2小时发一次,你甚至可以让它发到email里,写contact_groups即可,此时只需要加notification_options 去掉r,这样除了recovery,其他都发邮件了。假如你要维护只需要添加 check_period 即可
5.如何被动监控?安装send_nsca,在被管理端配置,让它自己搜集信息发给nagios server。
阅读(1140) | 评论(0) | 转发(0) |