监控告警思考

1. 告警分类不明确,无法对资源优先级较高的实施

2. 告警系统没有收敛,缺乏统一维护

3. 告警联系人无法紧密跟业务集合

4. 监控与告警,脱离,无法统一管控

5. 告警消息模版无法适应业务自定义需求

6. 业务告警场景增多,包括业务交易/应用性能等

7. 告警阈值用户缺乏自定义

8. 告警影响范围无法准备判断。业务端无法第一时间明确

9. 缺乏统一的告警看板

10.告警抑制缺失

11.告警升级缺失

12.告警太多,日志告警,系统告警,业务告警,网络告警,数据库告警混杂一块

13.缺乏对告警的数据分析,是否可以借助告警数据对数据进行线性建模

14.无法通过对告警的确认与告警产生的故障进行深入学习,或者是学习了,值产生了离线的数据,而不能产生自我学习的能力

15. 无法提前预防

16. 监与告,在业务场景下的联动性

本文分享自微信公众号 - 黑洞日志(heidcloud),作者:砥砺前行不负韶华

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-07-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • zookeeper监控告警

    一、ZooKeeper简介 ZooKeeper作为分布式系统中重要的组件,目前在业界使用越来越广泛,ZooKeeper的使用场景非常多,以下是几种典型的应用场景...

    三丰SanFeng
  • 告警监控系统开发

    老七Linux
  • Nginx的Upstream监控及告警

    之前写过一篇文章,介绍Nginx如何监控各server流量,主要是通过新增第三方status模块查看所有server及upstream状态进行查看,之后总有人问...

    李俊鹏
  • ElastAlert 基于Elasticsearch的监控告警

    Elastalert是Yelp公司用python2写的一个报警框架(目前支持python2.6和2.7,不支持3.x).

    Java后端技术
  • python 进程监控告警脚本

    监控进程是否存在,如果检测时不存在则发送告警短信,如果连续10次检测都不存在则发送告警电话。

    葫芦
  • 对监控系统的思考

    Jintao Zhang
  • 思考:prometheus 告警为什么选用alertmanager?

    alertmanager 主要用于接收 Prometheus 发送的告警信息,它支持多种告警通知渠道,而且很容易做到告警信息进行去重,降噪,分组等,超级好用。

    猿天地
  • Prometheus 监控报警系统 AlertManager 之邮件告警

    注意:这里为了快速方便启动 Prometheus、Alertmanager、Node-Exporter 服务,我使用 Docker 方式启动,所以本机需要安装好...

    哎_小羊
  • 腾讯云监控告警的使用

    腾讯云监控告警从添加用户及相关组,默认告警信息,也可以在Linux服务器中添加自定义告警。腾讯云的基础监控提供立体化云产品数据监控,智能化数据分析,实时化故障告...

    云加社区
  • SkyWalking - 实现微服务监控告警

    SkyWalking 告警功能是在6.x版本新增的,其核心由一组规则驱动,这些规则定义在config/alarm-settings.yml文件中。 告警规则的定...

    端碗吹水
  • 指标&监控&告警入门详解(二)

    作者:Justin Ellingwood 翻译:云监控团队 跟踪哪些类型的信息很重要? 您监控的值的类型和跟踪的信息可能会随着基础设施的发展而改变。由于系统...

    腾讯云监控团队
  • 5秒查看监控图表和告警

    电脑不在身边..... 收到告警后,如何查看告警详情? 如何查看实时查看 Dashboard 了解异常? 云监控小程序已全新改版,即点即用,随时随地查看告警详...

    腾讯云监控团队
  • 指标&监控&告警入门详解(三)

    作者:Justin Ellingwood 翻译:云监控团队 指标、监控、告警系统的重要特质 尽管每个监控程序或服务都各有利弊,但是做的比较好的通常具备一些重要...

    腾讯云监控团队
  • 指标&监控&告警入门详解(一)

    作者:Justin Ellingwood 翻译:云监控团队 前言 了解基础设施和系统的状态对于确保服务的可靠性和稳定性至关重要。有关部署的运行状况和性能的信息...

    腾讯云监控团队
  • spark过节监控告警系统实现

    马上要过年了,大部分公司这个时候都不会再去谋求开新业务,而大数据工匠们,想要过好年,就要保证过年期间自己对自己的应用了如执掌。一般公司都会有轮值人员,至少要有春...

    Spark学习技巧
  • Prometheus安装部署+监控+绘图+告警

    查看监控数据(https://grafana.com/dashboards/9276)

    DevOps云学堂
  • 监控和告警 | 网站被攻击了?

    前段时间,我的网站疑似被攻击了,今天带大家一起来事故现场看看,并且分享事故分析思路和事后防控手段。

    腾讯云开发TCB
  • ElastAlert监控日志告警Web攻击行为

    由于公司需要监控web攻击行为,而因某些原因搭不了waf,才不得不用ElastAlert进行告警,此为前提。 一、ELK安装 Elasticsearch 是一个...

    FB客服
  • RocketMQ 添加监控和系统告警通知

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://louluan.blo...

    亦山

扫码关注云+社区

领取腾讯云代金券