了解复杂IT系统的运行状态
监控系统分为两部分:
数据采集
主动模式(上报)(服务器开销小)
被动模式(采集)(服务器开销大)(专用客户端或公用协议)
数据存储分析报警展示部分
服务数量较小采用C/S就足够了.
大规模的监控环境产生的数据和网络连接开销非常巨大,而且跨地域,采用C/P/S架构,并考虑告警的有交汇报和集中汇报现象.
监控软件分流量监控(MRTG,CACTI,smokeping,graphite)和性能告警(nagios,zabbix,zenoss,core,ganglia,opentsdb)
MRTG: 主要用来绘制网络设备的流量图
Cacti: 在历史数据的展示监控方面功能相当不错.
smokeping: 用来监控网络性能.
graphite: 采集网站实时信息并进行统计的开源项目.
nagios: 功能侧重于监控服务的可用性,能及时根据触发条件告警.
zenoss core: 依靠一WEB界面来管理网络架构的状态和健康度.
ganglia: 适用于集群的自动化监控
openTSDB:支持秒级数据采集,支持大数据分析,前途不错.
zabbix: 分布式监控,总体做得非常优秀.
监控,防患未然,救人于膏肓之前.
减少人工干预,自动处理,严重故障,程序无法自动处理时才通知相关人员.
提供API,实时/非实时采集展示数据.
支持多种方式,具备可定制化功能.
阅读(1197) | 评论(0) | 转发(0) |