分类: LINUX
2013-12-09 15:39:25
一直在使用nagios做系统的监控管理,最多的一台nagios服务器已经管理了769台机器,5658个服务,运行良好,状态更新很及时,但在这个过程中做了很多优化,在此列举一下。
nagios的命令都是通过这个接收的,处理不过来的命令都会在这排队,如果你管理的service较多,建议将这个值调大。
有一次我的一个servicegroup下的service达到了3670个,导致nagios plugin返回127.将这个servicegroup下的service降到2900个后恢复正常。
这个设置缺省是关闭的,在监控的service较多的情况下,建议打开这个设置。
如果有部分service的监控状态一直不更新,建议将这个配置适度调大。参考值15
这个配置决定了处理检查结果的频率,如果这个值太大,会导致监控service的状态更新延时变大。参考值5
这个配置决定了每次处理检查结果最多可以花费的时间。这个值太大或太小都会导致监控service的状态更新延时变大。参考值5