Chinaunix首页 | 论坛 | 博客
  • 博客访问: 388601
  • 博文数量: 28
  • 博客积分: 3055
  • 博客等级: 中校
  • 技术积分: 310
  • 用 户 组: 普通用户
  • 注册时间: 2006-12-15 14:04
文章分类

全部博文(28)

文章存档

2009年(2)

2008年(2)

2007年(21)

2006年(3)

我的朋友

分类: LINUX

2007-08-10 13:22:11

Nagios 监控的主要内容,也是我们最为关注的内容是对服务的监控。Nagios中对服务的定义方式与上文中定义主机的方式一致,参数也大体相同。下面列出定义servce的参数,其含义大多在上文中介绍过了,此处及就不再介绍了。

define service {

host_name host_name

service_description service_description

servicegroups servicegroup_names

is_volatile [0/1]  #是否启用“volatile”模式。这个模式的含义是说名这个服务是不稳定的,或者说是危险的。只要其状态改变了,就不会再自己被恢复回来。这个参数很少使用,等到使用的时候我们再来细说。

check_command command_name

max_check_attempts #
normal_check_interval #

retry_check_interval #

active_checks_enabled [0/1]

passive_checks_enabled [0/1]

check_period timeperiod_name

parallelize_check [0/1]

obsess_over_service [0/1]

check_freshness [0/1]

freshness_threshold #

event_handler command_name

event_handler_enabled [0/1]

low_flap_threshold #

high_flap_threshold #

flap_detection_enabled [0/1]

process_perf_data [0/1]

retain_status_information [0/1]

retain_nonstatus_information [0/1]

notification_interval #

notification_period timeperiod_name n

otification_options [w,u,c,r,f]

notifications_enabled [0/1]

contact_groups contact_groups

stalking_options [o,w,u,c]

}


ok,还是让我们来举例说明一下吧。

1、随时监控Web.TEST主机上的HTTP服务(80端口),发生两次不能访问及认定是发生故障,故障累计3次告警,联系人组是mygroup。告警之后每两分钟再进行一次检查,如果10分钟之后仍然没有恢复,再发送一次告警。

define service {

host_name Web.TEST

service_description check_tcp 80

check_period 24x7

max_check_attempts 2

normal_check_interval 3

retry_check_interval 2

contact_groups mygroup

notification_interval 10

notification_period 24x7

notification_options w,u,c,r

check_command check_tcp!80

}


如果要检测其他服务,则将代码中蓝色的两行修改即可。例如,要检查默认的ssh服务是否开启:

define service {

host_name Web.TEST

service_description check_ssh

check_period 24x7

……

check_command check_ssh

}


在测试服务的时候,要充分发挥插件的功能,如何安装和使用插件,请看这篇文章
阅读(5222) | 评论(2) | 转发(1) |
给主人留下些什么吧!~~

chinaunix网友2009-04-23 09:56:42

请问博主有没有用过check_ide_smart这个插件。这类插件有个问题,因为要调用smartctl来侦测硬盘健康状态。非管理员用户是没有权限的。那怎样不提升权限就可以侦测硬盘健康状态呢? new_expect@126.com

海里的小鱼2008-10-28 09:48:27

如果要定义系统负载(system load)如何定义呢?