Chinaunix首页 | 论坛 | 博客
  • 博客访问: 191112
  • 博文数量: 17
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 767
  • 用 户 组: 普通用户
  • 注册时间: 2013-04-02 12:04
文章分类

全部博文(17)

文章存档

2015年(1)

2014年(7)

2013年(9)

我的朋友

分类: LINUX

2013-12-09 15:39:25

一直在使用nagios做系统的监控管理,最多的一台nagios服务器已经管理了769台机器,5658个服务,运行良好,状态更新很及时,但在这个过程中做了很多优化,在此列举一下。

1.调整external_command_buffer_slots

nagios的命令都是通过这个接收的,处理不过来的命令都会在这排队,如果你管理的service较多,建议将这个值调大。

2.避免servicegroup,hostgroup过大

有一次我的一个servicegroup下的service达到了3670个,导致nagios plugin返回127.将这个servicegroup下的service降到2900个后恢复正常。

3.设置use_large_installation_tweaks

这个设置缺省是关闭的,在监控的service较多的情况下,建议打开这个设置。

4.调整max_concurrent_checks

如果有部分service的监控状态一直不更新,建议将这个配置适度调大。参考值15

5.调整check_result_reaper_frequency

这个配置决定了处理检查结果的频率,如果这个值太大,会导致监控service的状态更新延时变大。参考值5

6.调整max_check_result_reaper_time

这个配置决定了每次处理检查结果最多可以花费的时间。这个值太大或太小都会导致监控service的状态更新延时变大。参考值5

阅读(2320) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~