10年工作经验,专研网站运维。
全部博文(454)
分类: 系统运维
2015-08-08 13:33:28
目录
服务器监控系统方案(Zabbix)
需要在测试环境下搭建监控服务器,然后找两台服务器作为测试机,经过测试通过再大规模使用。
免费的服务器监控系统有多种,比如Zabbix、Nagios、Cacti等都是比较主流的监控系统,此方案采用Zabbix作为监控系统,今后有机会对比其他监控系统,最终找到最适合我们架构的。
实时监视服务器每一个细节,发现异常,立刻查看相关信息,对故障排除有很大帮助;发现超过阀值,立刻自动报警
ZABBIX(中文名:栽贝克斯)监控系统
Zabbix软件是一个免费的C/S架构监控系统,根据系统架构可以无限扩展客户端。把所有的监控项集成到一个监控平台,在同一屏幕上同时查看多台服务器的监控信息,并且超过阀值自动报警。比如CPU利用率超过90%便会通过邮件通知管理员。
最低配置:1GB内存;LAMP环境;可以访问互联网;有root权限。
7.1 Web服务监控:响应时间、响应代码、下载速率(查看截图一)
7.2 单独应用占用系统性能(查看截图二)
7.3 网络性能:转发包速率和错误包统计(查看截图三)
7.4 CPU负载、内存利用率、swap使用率、硬盘剩余空间(查看截图四)
7.5 硬盘读写IO性能
7.6 主机是否存活(通过PING命令)
7.7 MySQL数据库监控:监控数据库状态、查询语句及主从复制监控。(帮助故障排除)
7.8 服务是否正常(通过监听服务端口)
7.9 Java应用程序监控(JBoss、Tomcat、WebSphere)
7.10 监控硬件健康状态(需要IPMI功能)
7.11 自定义监控脚本(自己编写脚本可以监控任何信息)
对报警信息及历史记录进行统计。(截图如下)
9.1 服务器搭建:(一周时间)
9.1.1 安装服务器系统
9.1.2 搭建LAMP环境
9.1.3 安装Zabbix系统
9.1.4 安装及配置其他组件
9.1.5 安装客户端软件
9.1.6 配置客户端软件连接服务器
9.1.7 排除软件启动报错信息。
9.2 服务器配置:(一周时间)
9.2.1 配置无代理监控信息
9.2.2 配置有代理监控信息
9.2.3 配置数据库监控信息
9.2.4 配置web服务器监控信息
9.2.5 配置阀值自动报警
9.2.6 配置信息统计功能
11.1 报警功能:根据每个监控项设置报警阀值,超过阀值会自动报警。
11.2 报警方式:邮件、短信、触发命令。
专人负责24小时查看监控信息,设置阀值报警并配置邮件报警,避免短信报警的误报。单独配置一台电脑负责24小时显示监控信息,所有工作人员都进行查看,出异常情况尽快联系运维人员。如果运维在家可以通过VPN进行判断故障,如需进一步处理,就立刻赶往公司。
13.1 它不能作为一台日志服务器。
13.2 它需要周期性维护。
13.3 最好单独使用一台服务器。
构建一套成熟的监控系统,可以帮助提前发现问题,并把故障解决在摇篮里。经常查看监控信息会对故障排除提供重大帮助。
如下是监控信息的截图:
15.1 截图一:(Web监控截图)
15.2 截图二:(Apache2和Mysql占用系统性能截图)
15.3 截图三(网络性能监控截图)
15.4 截图四:(硬盘利用率监控截图)
———————————————— 文章结尾 ————————————————