全部博文(403)
分类: LINUX
2009-06-09 10:56:39
参考资料
Nagios可以监控有IP可管理的交换机和路由器的设备状态。对小型无管理功能的交换机和HUB是无法监控。监控的方式是通过外部的ping所反馈的信息或者通过SNMP协议来获取相关的状态信息。
能够在网络设备上获取的信息包括:
监控的方式有两种
一种是利用ping的方式,获取数据包的响应时间和丢包率
另一种是利用网络设备的SNMP数据,通过check_snmp获取端口状态和check_mrtgtraf来了解带宽状况。
在使用check_snmp之前必须安装snmp包到系统中。如果没有安装则需要先安装好snmp系统包,然后再重新编译nagios plugins
5.配置Nagios
a.编辑/usr/local/nagios/etc/nagios.cfg
将#cfg_file=/usr/local/nagios/etc/objects/switch.cfg前面的#去掉
b.编辑/usr/local/nagios/etc/object/switch.cfg文件
设定监控主机的相关内容
define host{ use generic-switch ; Inherit default values from a template host_name Gateway ; The name we're giving to this switch alias Firewall ; A longer name associated with the switch address 192.168.200.1 ; IP address of the switch hostgroups allhosts,switches ; Host groups this switch is associated with }
监控包的丢失率和RTA响应时间
define service{ use generic-service ; Inherit values from a template host_name Gateway ; The name of the host the service is associated with service_description PING; The service description check_command check_ping!200.0,20%!600.0,60% ; 在超过200ms或丢包率在20%上的启动警告,超过600ms或丢包达到60%的启动报警 normal_check_interval 5; 在正常情况下,每五分钟监控一次 retry_check_interval 1; 在异常情况下,每分钟监控一次 }
利用SNMP监控交换和网关设备
define service{ use generic-service ; Inherit values from a template host_name Gateway service_description Uptime check_command check_snmp!-C public -o sysUpTime.0 } 利用MRTG来监控网络流量信息define service{
use generic-service ; Inherit values from a template host_name Gateway service_description Port 1 Bandwidth Usage check_command check_local_mrtgtraf!/var/lib/mrtg/192.168.200.1_1.log!AVG!1000000,2000000!5000000,5000000!10 }
利用command里面设定的check_local_mrtgtraf获取本地保存的mrtg流量日志信息来监控,获取文件是/var/lib/mrtg/192.168.200.1_1.log
获取数据值是采取AVG的值,数值在1M~2M之间,则状态改为warning,如果超过5M的话则状态改为critical
完成配置后service nagios restart