Chinaunix首页 | 论坛 | 博客
  • 博客访问: 130007
  • 博文数量: 33
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 207
  • 用 户 组: 普通用户
  • 注册时间: 2018-10-31 09:33
文章分类

全部博文(33)

文章存档

2020年(5)

2019年(24)

2018年(4)

我的朋友

分类: IT职场

2019-03-28 09:32:00

在数据中心机房越来越专业化的今天,机房人员不仅需要自身实力过硬,还要对监控系统有所了解。在有些企业的运维人员面试中,容易被问到这方的知识,多懂一点总是好的。

监控面试

在运维面试中,常常会被问题监控相关的问题,那么这个问题到底该如何来回答,我针对本文给大家提供了一个简单的回答思路。

1、硬件监控

通过 SNMP 来进行路由器交换机的监控(这些可以跟一些厂商沟通来了解如何做)、服务器的温度以及其他,可以通过 IPMI 来实现。当然如果没有硬件全都是云,直接跳过这一步骤。

2、系统监控

如 CPU 的负载、上下文切换、内存使用率、磁盘读写、磁盘使用率、磁盘inode 使用率。当然这些都是需要配置触发器,因为默认太低会频繁报警。

3、服务监控

比如公司用的 LNMP 架构,Nginx 自带 Status 模块、PHP 也有相关的Status、MySQL 的话可以通过 Percona 官方工具来进行监控。Redis 这些通过自身的 Info 获取信息进行过滤等。方法都类似。要么服务自带。要么通过脚本来实现想监控的内容,以及报警和图形功能。

4、网络监控

如果是云主机又不是跨机房,那么可以选择不监控网络。当然你说我们是跨机房以及如何如何。推荐使用Smokeping来做网络相关的监控。或者直接交给你们的网络工程师来做,因为术业有专攻。

5、安全监控

如果是云主机可以考虑使用自带的安全防护。当然也可以使用Iptables。如果是硬件,那么推荐使用硬件防火墙。使用云可以购买防DDOS,避免出现故障导致 Down 机一天。如果是系统,那么权限、密码、备份、恢复等基础方案要做好。Web 同时也可以使用Nginx+Lua来实现一个Web层面的防火墙。当然也可以使用集成好的Openresty。

6、Web监控

Web监控的话题其实还是很多。比如可以使用自带的 Web 监控来监控页面相关的延迟、js响应时间、下载时间等等。这里我推荐使用专业的商业软件,监控宝或听云来实现。毕竟人家全国各地都有机房。(如果本身是多机房那就另说了)

7、日志监控

如果是 Web 的话可以使用监控Nginx的50x40x的错误日志,PHP的Error日志。其实这些需求无非是收集、存储、查询、展示,我们其实可以使用开源的ELK Stack来实现。

8、业务监控

我们上面做了那么多,其实最终还是保证业务的运行。这样我们做的监控才有意义。所以业务层面这块的监控需要和开发以及总监开会讨论,监控比较重要的业务指标,然后通过简单的脚本就可以实现,最后设置触发器即可。

9、流量分析

平时我们分析日志都是拿 Awk Sed 等一堆工具来实现。这样对我们统计 IP、PV、UV不是很方便。那么可以使用百度统计、Google统计,让开发嵌入代码即可。为了避免隐私也可以使用 Piwik来做相关的流量分析。

10可视化

通过 Screen 以及引入一些第三方的库来美化界面,同时我们也需要知道,订单量突然增加、突然减少。或者说突然来了一大波流量,这流量从哪儿来,是不是推广了,还是被攻击了。可以结合监控平来梳理各个系统之间的业务关系。

本文转载自

阅读(1820) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~