客户反馈现网监控告警,设备重启,登录设备查看发现设备并没有重启,登录监控系统监控了设备
snmp oid 1.3.6.1.2.1.1.3.0,oid 1.3.6.1.2.1.1.3.0 返回值最大为2^32即4294967296,且数值单位是百分之一秒,最大值能表示497天,达到最大值后归0
查看监控触发器{hostname_xxx:sysUpTime.last()}<1h and {hostname_xxx:sysUpTime.prev()}< 42949036,表达的并不准确,此表达式表示:只要设备启动时间小于一小时,并且设备运行时间小于42949036秒则告警,此表达式不能规避oid数值超限问题,设备oid返回值只要超限,必报设备重启!!!
此处分析一下,假定zabbix snmp oid get周期1分钟:

经过查阅资料,假定snmp oid get周期1分钟,以及推理,zabbix 重启告警触发器表达式可如下:{hostname_xxx:sysUpTime.change()}<0 and {hostname_xxx:sysUpTime.prev()}< 4294961296
如果zabbix对oid返回数值做单位换算,如百分之一,则上述表达式应该如下:{hostname_xxx:sysUpTime.change()}<0 and {hostname_xxx:sysUpTime.prev()}< 42949612
此表达式缺陷:黑点和红点之间 snmp get 成功 且设备异常掉电。此事件概率极小!!!
42949612数值是根据监控系统snmp get 周期换算而得,请根据现网snmp get 周期换算!!!
阅读(113) | 评论(0) | 转发(0) |