Chinaunix首页 | 论坛 | 博客
  • 博客访问: 312823
  • 博文数量: 118
  • 博客积分: 313
  • 博客等级: 二等列兵
  • 技术积分: 615
  • 用 户 组: 普通用户
  • 注册时间: 2011-11-12 22:51
文章分类

全部博文(118)

文章存档

2012年(68)

2011年(50)

分类:

2012-02-21 22:03:06

 Nagios远程监控软件的安装与配置详解

 Nagios是一款功能强大的网络监视工具,它可以有效的监控windows、linux、unix主机状态以及路由器交换机的网络设置,打印机工作状态等,并将状态出现异常的服务及时以邮件、msn短信等形式第一时间通告管理员。由于它是一款遵循GPLv2的开源网络监控软件,以其出色的性能低廉的使用成本,深受广大用户的好评。  

nagios的主要监控功能有:

1)监控网络服务(HTTP、POP3、SMTP、PING、MySQL等)

2)监控主机资源(磁盘空间利用率、内存利用率、CPU负载等)

3)简洁的插件设计接口,使得用户可以轻松开发所需的检测脚本(运维则可直接找到相关脚本并使用) 

4)并行服务模式 

5)轻松描述网络结构,并且能够区辨“宕机”和“主机不可达” 

6)通过邮件或用户自定义的方式将主机或服务的工作状态变化情况通知给管理员6)当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式)  可以通过飞信,等方式实现时,既可传递给管理员,可高效的保证服务器的维护

7)自动日志滚动 

8)支持以冗余方式进行主机监控

9)可以通过web方式直观的查看当前网络状态、通知和问题历史、日志文件等等,此组件为可选

Nagios相关的配置文件: 

nagios.cfg为其主配置文件其中可以定义nagios的一些基本工作状态可监控机的配置文件; 

command.cfg其为nagios的监控命令配置文件,在其中可定义nagios在监控过程中针对某项服务所使用到得命令; 

contact.cfg其为nagios报警途径配置文件,它用来定义一旦监控到某台主机状态异常或某服务状态为离线通知运维人员的方法; 

timeperiods.cfg用于定义nagios向运维人员发送报警的周期时间频率等; resource.cfg用于定义nagios监控服务所使用到脚本所在路径; 

templates.cfg中定义的是nagios监控各项主机或服务属性状态所需的模板。

工作原理不在赘述,直接上图

下文将包括这些内容:安装配置最新版nagios V3.3.1、添加定义被监控Windows主机和Linux主机、具体服务的监控、出现异常情况报警手段定义以及配置过程中笔者所遇到并解决的一些问题。

废话不多说,直接开始配置内容

1.到nagios官网下载到最新版的nagios-3.3.1.tarnagios-plugins-1.4.15.tarnrpe-2.12.tar以及windows的客户端nsclient_201.zip

2.安装nagios部署过程中需要依赖到得其他软件和库文件

  1. yum groupinstall -y 'Development Libraries' 'Development Tools" 'Legacy Software Development' 'X Software Development' 
  1. yum -y install httpd gcc glibc glibc-common *gd* php php-mysql mysql mysql-server mysql-devel openssl-devel 
  2. # 安装Nagios必须的基本组件的运行依赖于httpd、mysql、gd以及编译用到的gcc 

Nagios 监控端程序的安装及配置

1.添加nagios用户和组

  1. groupadd nagcmd 
  2. #添加与nagios运行相关服务的组 
  3. useradd -m nagios 
  4. #添加nagios用户 
  5. usermod -a -G nagcmd nagios 
  6. #将nagios用户追加附加组 
  7. usermod -a -G nagcmd apache 
  8. #将apache用户追加nagcmd组使之工作时具有足够的权限 

2.编译安装nagios 3.3.1

  1. tar xvf nagios-3.3.1.tar.gz 
  2. cd nagios 
  3. # ./configure --with-command-group=nagcmd --enable-event-broker  
  4. #默认安装路径在/usr/local/nagios/ 
  5. make all && make install && make install-init && make install-config && make install-commandmode && make install-webconf 
  6. #安装主程序、添加初始化程序、生成配置文件、生成web配置文件 

make install-webconf的作用/etc/httpd/conf.d/nagios.conf生成web相关配置文件,用于定义nagios使用的CGI选项,web的身份认证等 

  1. htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin 
  2. New password:  
  3. Re-type new password:  
  4. Adding password for user nagios 
  5. #为nagios的web页面创建账号密码,对访问进行身份认证 
  6. service httpd restart 
  7. chkconfig httpd on 
  8. #启动httpd,并设置开机启动  

PS:此处用户名尽量使用默认nagiosadmin,否则就需要修改cgi.cfg文件中所有关于认证选项的用户 

3.编译安装nagios-plugins  

nagios的所有监控工作都是由nagios-plugins插件完成的,因此,在启动nagios之前还需要为其安装nagios-plugins 

  1. tar xvf nagios-plugins-1.4.15.tar.gz  
  2. cd nagios-plugins-1.4.15 
  3. ./configure --with-nagios-user=nagios --with-nagios-group=nagios --with-mysql 
  4. #添加mysql依赖 
  5. make && make install 
  6. #编译并安装 
 Ps:作者在安装nagios-cn-3.2.3.tar过程中,在此处编译完成发现mysql关联库文件本跳过。经分析原因是由于在编译nagios时修改了nagios的默认安装路径(非/usr/local/nagios)。  解决办法: 
  1. cp /usr/lib/mysql/mysql_config /usr/lib/pkgconfig/ 
  2. #将mysql的配置文件放在这个目录下使之能够在编译过程中读到相关配置选项 
  3. 再进行编译安装nagios-plugins

4.测试配置文件语法并尝试启动nagios

  1. chkconfig --add nagios 
  2. chkconfig nagios on 
  3. #添加nagios到开机启动项 
  4. vim /etc/profile  
  5. PATH=$PATH:/usr/local/nagios/bin 
  6. #向profile加入这一行,指明nagios命令的path  
  7. . /etc/profile 
  8. nagios -v /usr/local/nagios/etc/nagios.cfg 
  9. #检查配置文件的语法 
  10. service nagios start 
  11. #如语法监测为报错则尝试开启服务 

注意:此时需要关闭SELINUX或针对nagios对SELIUNX进行配置

  1. 方法一、直接关闭selinux 
  2. getenforce 
  3. #查看selinux的运行状态 
  4. setenforce 0 
  5. #如果是enforce(开启)状态,则关闭 
  6. Ps:如果您想在今后的使用中完全关闭selinux,可以通过编辑/etc/sysconfig/selinux文件,将其中的selinux后面的值“force”修改为“disable”即可。 
  7.  
  8. 方法二、修改相关文件的type 
  9. chcon -R -t httpd_sys_content_t /usr/local/nagios/sbin 
  10. chcon -R -t httpd_sys_content_t /usr/local/nagios/share 
  11. #进行这些操作就可以在selinux开启的状态下正常访问nagios 

5.打开浏览器检测nagios的工作情况

注意:如果htpasswd生成的密码没有使用的默认的nagiosadmin则会导致无法正常显示监控信息,将cgi.cfg中use_authentication=1改成0虽能显示主机信息但在手动刷新服务状态时报错

 解决方法:将cgi.cfg中认证用户改成htpasswd生成的用户;或按照cgi.cfg认证功能用户从新生成htpasswd。 

配置监控Windows主机

 1.修改nagios主配置文件

  1. vim /usr/local/nagios/etc/nagios.cfg 
  2. cfg_file=/usr/local/nagios/etc/objects/windows.cfg 
  3. #将这一行注释去掉 

2.修改用来定义windows的配置文件

  1. vim /usr/local/nagios/etc/objects/windows.cfg 
  2. define host{ 
  3.         use             windows-server  ; Inherit default values from a template 
  4.         host_name       winserver       ; The name we're giving to this host 
  5.         alias           My Windows Server       ; A longer name associated with the host 
  6.         address         192.168.0.72   ; windowsIP 
  7.         } 
  8. #修改IP,此ip为windows主机IP 

 配置监控Linux主机

1.编译安装nrpe

  1. tar xvf nrpe-2.12.tar 
  2. cd nrpe-2.12 
  3. ./configure --enable-ssl --with-ssl-lib=/lib/ 
  4. make all && make install-plugin 

2.在nagios中定义nrpe

  1. vi /usr/local/nagios/etc/objects/commands.cfg 
  2. #check nrpe 
  3. define command{ 
  4.         command_name check_nrpe 
  5.         command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1
  6.         } 
  7. #在末行添加这些内容 

3.创建定义linux的配置文件

  1. vim /usr/local/nagios/etc/objects/mylinux.cfg
  2. define host{ 
  3.            use             linux-server 
  4.           host_name     mylinux 
  5.           alias            mylinux 
  6.           address        192.168.0.72#客户端IP即被监控的IP 
  7.         } 
  8.  
  9. define service{ 
  10.         use                      generic-service 
  11.         host_name             mylinux 
  12.         service_description     check-load 
  13.        check_command         check_nrpe!check_load 
  14.                } 
  15. define service{ 
  16.         use                      generic-service 
  17.         host_name             mylinux 
  18.        service_description     check-users 
  19.        check_command        check_nrpe!check_users 
  20.                } 
  21. define service{ 
  22.         use                    generic-service 
  23.         host_name           mylinux 
  24.         service_description  otal_procs 
  25.         check_command     check_nrpe!check_total_procs 
  26. }  
  27. chown -R nagios:nagios mylinux.cfg

  28. #修改配置文件的属主属组

4.修改配置文件

  1. vim /usr/local/nagios/etc/nagios.cfg 
  2. cfg_file=/usr/local/nagios/etc/objects/mylinux.cfg 
  3. #在主配置文件指明linux主机的配置文件路径 

Windows 监控端配置

安装NSClient,进入安装目录修改配置文件NSC.ini,将[module]下所有库文件的注释删去。运行nsclient。

Linux 监控端配置

1.添加nagios用户

  1. useradd nagios  

2.编译安装nagios-plugin

  1. tar zxf nagios-plugins-1.4.15.tar.gz  
  2. cd nagios-plugins-1.4.15 
  3. ./configure --with-nagios-user=nagios --with-nagios-group=nagios 
  4. make && make install 

3.编译安装nrpe 

  1. yum install openssl-devel 
  2. #先安装openssl解决依赖 
  3. tar -zxvf nrpe-2.12.tar.gz 
  4. cd nrpe-2.12.tar.gz 
  5. ./configure --enable-ssl --with-ssl-lib=/usr/lib/ 
  6. make all && make install-plugin && make install-daemon && make install-daemon-config 
  7. #编译安装 

4.配置并启用nrpe 

  1. vim /usr/local/nagios/etc/nrpe.cfg 
  2. allowed_hosts=192.168.0.71 
  3. #监控端的IP 
  4. /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg –d 
  5. #开启进程 

 监控端重启nagios服务 

  1. service nagiso restart 

浏览器刷新页面,即出现windows和linux被监控主机 

监控服务的添加

下面就添加被监控主机mysql服务为例进行说明

 1.被监控机(192.168.0.72)安装mysql并创建监控用户

  1. yum install mysql mysql-server 
  2. #简单起见yum安装mysql 
  3. service mysqld start 
  4. #启动mysql 
  5. mysqladmin -uroot -p password '123456' 
  6. #给root用户创建mysql密码 
  7. mysql -uroot -p 
  8. #进入mysql 
  9. mysql> create database nagios;  
  10. #创建数据库 
  11. mysql> grant select on nagios.* to nagios@'%' identified by 'redhat';  
  12. #给nagios用户赋予查询权限 
  13. mysql> flush privileges;  
  14. #刷新特权表 

2.监控机(192.168.0.71)修改相关配置文件 

  1. vim /usr/local/nagios/etc/objects/command.cfg 
  2. #check mysql  
  3. define command{  
  4. command_name check_mysql  
  5. command_line $USER1$/check_mysql -H 192.168.0.72 -u nagios -d nagios -p redhat  
  6. }  
  7. #在命令配置文件中添加这些字段 
  1. vim /usr/local/nagios/etc/objects/mylinux.cfg  
  2. define service{ 
  3.         use                    generic-service 
  4.         host_name           mylinux 
  5.         service_description  check_mysql 
  6.         check_command     check_mysql 
  7. }         
  8. #在linux主机配置文件中定义服务 

 重启服务

  1. service nagios restart 

刷新浏览器页面

异常报警

这里选用飞信作为异常报警手段,异常事件出发直接以短信形式通知运维人员

1.飞信的安装

  1. unzip fetion.zip
  2. cd ../fetion 
  3. mv fetion /usr/bin/ 
  4. #将飞信脚本放在/usr/lib 
  5. chmod +x /usr/bin/fetion 
  6. #添加执行权限 
  7. mv ./* /usr/lib 
  8. #将剩余所有库文件移动到/usr/lib  

Ps:飞信程序已上传至本文附件中 

2.修改nagios相关配置文件

  1. vim /usr/local/nagios/etc/templates.cfg 
  2. define contact{ 
  3.         name                            generic-contact         
  4.         service_notification_period     24x7                     
  5.         host_notification_period        24x7                    
  6.         service_notification_options    w,u,c,r,f,s           
  7.         host_notification_options       d,u,r,f,s               
  8.         service_notification_commands   notify-service-by-fetion 
  9.         host_notification_commands      notify-host-by-fetion     
  10.         register                        0                       
  11.         } 
  12. #修改成上面字段 
  13.  
  14. vim /usr/local/nagios/etc/commands.cfg 
  15.  commands.cfg 
  16. define command{ 
  17.         command_name notify-service-by-fetion 
  18.         command_line      /usr/bin/fetion --mobile 您的手机号 --pwd 您的飞信密码 --to 您的手机号 --msg-tpye=0  --msg-utf8 $HOSTNAME 
  19.   #添加这些字段 

重启服务使配置文件生效    

关于nagios的配置流程以及应用添加就先写到这里,以上内容在您实现过程中出现的任何问题,欢迎在此交流; 并请各位高手前辈大神达人予以批评指正,谢谢!


 

本文出自 “ 远 飏 ” 博客,请务必保留此出处http://evolution.blog.51cto.com/3343305/660082

阅读(1507) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~