分类: 系统运维
2016-06-14 17:41:36
本文主要配置验证zabbix执行远程命令。
Server:基于CentOS-7-x86_64-1511;
Zabbix:zabbix-3.0.1server/agent。
一些能想到的比较重要的注意事项:
1. 远程执行命令是server端向agent端执行,不支持主动模式的agent;
2. 不支持代理模式;
3. zabbix用户必须对命令具有执行权限,可以使用sudo赋予root权限(配置sudo无密码方式);
4. 远程命令只是执行,执行成功与否并不检测并确认,可在” Monitoring-->Events”中查看action执行时,或在”Reports-->Action log”中查看远程命令是否执行成功(成功为” Executed”)。
通过一个简单的示例验证:
监控服务器实时在线的用户不超过2个,超过阀值时报警,并执行命令,强制使第3个登录用户下线,以使监控项在阀值以下。
Configuration-->Templates-->选择” Template OS Linux”模板的”Triggers”-->Create trigger
Name:User login number gt 2 on {HOST.NAME}
#trigger name自定义,可使用宏
Expression:{Template OS Linux:system.users.num.last()}>2
#可以点击”Expression”项后的”Add”,使用zabbix自带的Item +
Function设置阀值的表达式,如下:
Severity:Warning
#自定义的级别
其余默认值即可,设置完成后如下,点击”Add”即完成:
agent默认不支持执行远程命令,需要在agent的配置文件中打开此参数。
点击(此处)折叠或打开
#agent.conf文件路径根据实际情况修改,这里是编译安装后自定义的路径,请见http://blog.chinaunix.net/uid-26168435-id-5728816.html
#agent.conf文件修改后需要重启进程
Configuration-->Actions-->Create action
在Action选项中,
定义Name:Limit the number of online users no more than 2
#action name自定义即可,action选项的其余部分可采用默认值,如下:
在Conditions选项中添加新的条件判断,以使判断更有针对性,如
New condition:Trigger severity = Warning
New condition:Trigger name like User login number gt 2
#trigger name对应步骤1中定义的trigger
name,如下:
在Operations选项中,添加新的”Action operation”,点击”New”,
Operation type:选择”Remote Command”
Target list:添加target为”Current host”
#agent在本机
Type:选择”Custom script”
Execute on:选择”Zabbix agent”,命令为” sudo /root/test.sh”
#执行命令的账号是zabbix账号,非root账号,不采用sudo命令会导致命令执行后不生效
#另外需要说明是,我在这里尝试过使用具体的命令而非脚本,结果是命令执行了但不生效,因为没有具体的失败日志,也分析不出原因
#其余部分采用默认值,点击”Add”即可,如下:
根据步骤3中定义的命令脚本的路径,编辑命令脚本。
点击(此处)折叠或打开
#这里简单的认为第3个登录的tty为pts/2
点击(此处)折叠或打开
#授予zabbix账号sudo无密码执行命令的权限,如果为了安全性,可将最后一个”ALL”定义为具体的命令
#或在步骤4中将脚本owner修改为zabbix,并具有执行权限,但要注意脚本放置目录对zabbix账户开放可执行权限甚至可写权限,这样步骤3中脚本也不需要sudo赋予权限
远程登录主机3个tty,不在CLI下做其他任何操作,触发trigger阀值,触发命令动作强制第3个登录用户下线。
从截图可以看到,在线用户超过阀值,trigger为”PROBLEM”状态只持续了1分钟左右,即恢复到”OK”状态,表明强制第3个用户下线的脚本命令已执行,并且执行成功。
从”Number of logged in users” Item的历史数据中也可看到trigger触发时,第3个登录用户即被下线。
在登录的第3个tty下,可看到连接由主机自行中断(显示本地时间,与上图的主机时间有偏差)。