Chinaunix首页 | 论坛 | 博客
  • 博客访问: 657516
  • 博文数量: 121
  • 博客积分: 1425
  • 博客等级: 中尉
  • 技术积分: 2059
  • 用 户 组: 普通用户
  • 注册时间: 2012-04-03 15:34
文章分类

全部博文(121)

文章存档

2018年(1)

2017年(2)

2016年(1)

2015年(11)

2014年(14)

2013年(47)

2012年(45)

分类: IT职场

2013-07-16 17:47:25

Nrpe详解
先用表格列举一下我的监控对象和阀值:


监控对象
监控阀值
 
 
 
 
 
 
主机存活:
check_ping
 
-w 3000.0,80% -c 5000.0,100% -p 5(3000毫秒响应时间内,
丢包率超过80%报警告,5000毫秒响应时间内,丢包率超过
100%报危急,一共发送5个包)
登录用户:
check_user
-w 5 -c 10(w为警告,c为危急)
系统负载:
check_load
-w 15,10,5 -c 30,25,20(1分钟,5分钟,15分钟大于对应
的等待进程数则警告或危急)
磁盘占用率:
check_disk
-w 20% -c 10% -p /(根分区剩余空间为总大小的20%警告,
10%危急,-p后是根分区)
脚本检测磁盘I/O:
check_iostat
-w 5 –c 10 (磁盘I/O的iowait超过5%报警告,超过10%报危急)
检测僵尸进程:
check_zombie _procs
-w 5 -c 10 -s Z(有5个僵尸进程报警告,10个报危急)
检测总进程数:
check_total_procs
-w 150 -c 200(总进程到150个警告,200个报危急)
脚本检测内存剩余:
check_mem
-w 90% -c 95%(内存空闲率90%以上报警告,95%以上报危急)
检测交换分区使用率:
check_swap
-w 20% -c 10%(交换分区剩余空间为总大小的20%警告,
10%危急)
监控服务端口:
check_tcp
-H localhost2 -p 80(主机与对应的端口号)
 
监控页面响应时间:
check_http
-H localhost2 -u http:\/\/localhost2/test.jsp –w 5 –c 10(检查页面,超过5s报警告,超过10s报危急)
脚本检测IP连接数:
check_ips
-w 200 –c 250(IP连接数超过200报警告,超过250报危急)
流量
监控
监控server流量:
Check_traffic
-V 2c -C public -H localhost2 -I 2 -w 12,30 -c 15,35 -M –b(snmp版本,用户,主机,对应网卡,警告阀值,危急阀值)


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 















找到vim /usr/local/nagios/etc/nrpe.cfg
里面有一些默认的模板了:
# The following examples use hardcoded command arguments...
command[check_users]=/opt/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/opt/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_hda1]=/opt/nagios/libexec/check_disk -w 20 -c 10 -p /dev/hda1
command[check_zombie_procs]=/opt/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/opt/nagios/libexec/check_procs -w 150 -c 200
这些命令是由主控端check_nrpe来执行来远程监控主机资源!我们可以修改这些选项,还可以添加一些自己想监控的东西,比如自己写的脚本等!
下面是我修改后的配置,只简单列了下,以供参考:
# The following examples use hardcoded command arguments...
command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/hda1
command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200
command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10%
command[check_disk]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /
command[check_ips]=/usr/local/nagios/libexec/ip_conn.sh 200 250
command[check_mem]=/usr/local/nagios/libexec/check_mem.sh -w 90% -c 95%
command[check_iostat]=/usr/local/nagios/libexec/check_iostat -w 5 -c 10
command[check_traffic]=/usr/local/nagios/libexec/check_traffic.sh -V 2c -C public -H localhost2 -I 2 -w 12,30 -c 15,35 -M –b
阅读(1367) | 评论(0) | 转发(0) |
0

上一篇:nagios 监控mysql

下一篇:nagios 监控磁盘 io

给主人留下些什么吧!~~