分类: 系统运维
2013-02-01 14:41:25
原文地址:nagios监控应用 作者:huyanshu
nagios监控应用分两块, 一块为服务器端,一块为客户端。服务端配置文件在/usr/local/nagios/etc/objects,即可以监控linux,又可以监控windows,同时也可以监控打印机,和交换机。同时也可以发邮件。
服务端监控linux服务器的文件为/usr/local/ngios/etc/localhost.cfg,最主要分为三块。
define host{
use linux-server ; Name of host template to use
; This host definition will inherit all variables that are defined
; in (or inherited by) the linux-server host template definition.
host_name
alias
address
}
这个为主机块,需要告诉nagios,计算机名,别名,地址,使用的是 linux
define hostgroup{
hostgroup_name ; The name of the hostgroup
alias ; Long name of the group
members ; Comma separated list of hosts that belong to this group
}
这块为主机组名,别名,成员。
define service{
use local-service ; Name of service template to use
hostgroup_name
service_description checksapce_root
check_command check_local_disk!20%!10%!/root
}
这块就是可以监控的本地的服务名。
define service{
use local-service ; Name of service template to use
hostgroup_name
service_description HTTP
check_command check_http
notifications_enabled 1
}
这块跟上面一样,最主要的是本地服务。
nagios即可以监控进程,也可以监控端口。/usr/local/nagios/libexec,这个目录最主要放nagios监控插件,只要check_*** -h,就可以跟据显示来增加参数。也可以自己写脚本。
/usr/local/nagios/etc/cotacts.cfg,这份文件主要有两块,一块是要发送的邮件,一块是用户名。
/usr/local/nagios/etc/commands.cfg,最主要添加命令参数。
/usr/local/nagios/etc/printer.cfg,是监控打印机参数。
/usr/local/nagios/etc/switch.cfg,是监控网络设备,要开起snmp协议。
/usr/local/ngios/etc/templates.cfg,是监控服务器的一些网络信息,比如能否通,是否宕机。
/usr/local/nagios/etc/timeperods.cfg,是时间上的监控,你可以哪段时间进行监控,哪段时间不监控。
/usr/local/nagios/etc/windows.cfg,是监控windows服务器的
/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg 这句话是可以检查你的配置文件那条有错。
在/usr/local/nagios/etc/resource.cfg文件里面你可以增加用户,比如oracle
在客户端里面最主要改的是/usr/local/nagios/etc/nrpe.cfg 这份文件,根据服务端的设置来增加参数
command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_hda2]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/sda1
#command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200
command[check_swap]=/usr/local/nagios/libexec/check_swap -a -w 50 -c 30
command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/sda2
command[check_disk]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/sda5
command[check_tcp]=/usr/local/nagios/libexec/check_tcp -H host145 -p 1521 -c 2 -w 1
command[check_oracle]=/usr/local/nagios/libexec/check_oracle --db olbak
command[check_oracle1]=/usr/local/nagios/libexec/check_oracle --db ORAUP02
command[check_oracle2]=/usr/local/nagios/libexec/check_oracle --db smssite
command[check_oracle3]=/usr/local/nagios/libexec/check_oracle --db jt2
command[check_oracle4]=/usr/local/nagios/libexec/check_oracle --db jt3
command[check_mem]=/usr/local/nagios/libexec/mem.sh -w 10 -c 5
最后需要做的是启动客户端,/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
这样就能和服务端很好的配合进行监控。nagios的监控端口是5666,tcp的,记得一定要开。