Chinaunix首页 | 论坛 | 博客
  • 博客访问: 101420
  • 博文数量: 31
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 350
  • 用 户 组: 普通用户
  • 注册时间: 2019-09-26 17:39
文章分类
文章存档

2021年(10)

2020年(20)

2019年(1)

我的朋友

分类: 系统运维

2021-09-27 22:20:12

现在市面上的监控平台有很多但是针对告警的管理方面的能做的就少之又少这时候我们就需要一款第三方的平台来提供告警的服务睿象云智能告警平台 Cloud Alert以下简称CA就是一款告警管理平台是针对监控平台的告警所提供的一系列服务那他都可以做到哪些呢就让我们后续看下吧

告警的统一管理

很多公司的监控平台的不止一个这就导致每个监控平台所产生的告警都是独立的无论是查看还是处理都是比较大的工作量这也就导致了告警的处理效率的下滑进而影响业务的流畅度CA提供了多种监控平台的对接方式用户可以将各个监控平台鹅告警发送到CA中并且在收到各个监控的告警之后会进行统一的标准化数据处理方便用户对告警的管理

灵活的分派

在产生的告警中不同的业务线所产生的告警所通知的人也不同这里面可能包含不同主机的告警告警内容的不同或者某个指标不同等并且如果告警没能及时处理也需要通知到领导或者其他人CA所提供的分派策略功能可以实现通过多样化的筛选条件来通知相应的负责人并且也能实现告警无人处理时通知到下一负责人或者领导

多样化的通知方式

监控平台的告警大多数只有邮件告警通知或者其他的单一通知方式单一的告警通知方式往往不能解决实际的复杂告警情况例如夜间或者严重的告警邮件通知不能实现有效的通知需求或是需要多人处理的告警单一的通知方式也不能实现协作处理CA目前支持电话短信微信邮件app的多种通知方式不仅可以实现重要的告警或者夜间的告警电话通知让告警通知最大化也可以实现通过app移动端处理告警满足当下移动端的需求并且CA支持钉钉企业微信飞书等多样化的协作通知方式满足告警多人协作处理的需求

智能降噪

监控平台产生的告警数据往往存在着很多无效告警这些无效的告警通常会影响甚至误导运维人员查找问题的根因并且每当告警风暴产生时大量的无效的告警通知更会让运维人员无所适从这时候就需要一个能够梳理告警的一个平台CA可以通过平台已有的智能算法实现对告警的压缩降噪也可以用户自定义压缩规则实现将无效的告警压缩整合在减少了一些不必要的告警同时也能让用户更快速的找到有效告警进而更快速的找到根因

风暴预警

运维监控工具/平台产生异常时,会在短时间内产生异常数量的告警,如果未能及时发现,可能会影响到整体的业务流程,所以CA引入了风暴预警的功能,用户可以在风暴预警的功能中,设置指定时间段内,产生告警的数量阀值,当告警数量超过阀值时,就会通知到相关负责人。

根因定位

在网络中断、系统上线升级、设备多监控项多等情况下,就可能会引发大批量的告警,这就会导致告警发生后,运维人员排查根因困难,拉长了整体的告警处理进度,从而影响整体的业务。告警的根因往往是运维人员最想排查出的问题只有解决了根因才能第一时间恢复告警减少后续的告警通知优化系统和业务CA平台推出的根因定位功能可以根据用户告警通过平台的算法训练出独有的关系拓扑图通过这样的拓扑图系统会给用户推荐根因告警的原因是什么进而帮助用户快速的发现告警的根因同时也支持用户自行标记告警的根因层级进而训练出独有的关系拓扑图

以上就是睿象云智能告警平台针对告警的管理方式睿象云目前也在持续的优化和改进后续有新的功能也会第一时间和大家分享哒

阅读(874) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~