怎么样做好日志类的报警监控

上一篇文章写了普通数字类型类型的监控报警,本文谈一下怎么样做好日志类的监控和报警

一、日志类报警的特点

   1、接受人员希望直接看到日志的内容;

   2、对应技术栈涉及比较广的系统,,一个问题会引发不同主机上面不同系统同时产生日志。举例:openstack 的nova在保存快照时出错,会引起nova-api,galnce-api,horizen同时产生错误日志。

二、遇到的痛点:

    1、有很多人想随时查看日志,不同的人想要查看不同的日志;

    2、日志类的报警,不适合用微信直接发送内容,原因一是转义麻烦,二是微信的消息长度有限制;

    3、日志类的报警,报警风暴很多,往往一来一大波,但是很难对报警风暴进行聚合;

    4、往往在收到报警时候,接警人员想同时看看同一个时间点其他系统的日志;

    5、kibana的用户鉴权是收费用户,同时将kibana映射到公网给运维人员似乎很不靠谱。

三、解决方案

    1、kibana的手机化,kibana是个非常棒的前端展示平台,如果有个类似的平台能手机化,在手机上实现随时查看、检索、报警推送,那简直完美。

    2、自己写一个小型的系统,来实现日志的报警,展示,用户鉴权等基本功能

四、一些成果

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏网站设计制作、数字营销

网站制作前网站主机空间的选择

无论是企业公司还是学校教育机构等事业单位,网站制作完成之后往往需要将网站上传配置到相应的主机空间中。网站的主机空间的选择也是一项重要的工作,通常是由网站制作公司...

2823
来自专栏编程

大型分布式服务器架构原理解析

作为技术人员,我们都知道:几乎所有的项目,都是由简单到复杂,从单一服务器到集群服务器进行开发。但又有多少人知道这其中的技术原理呢?其实,这并不是那么深奥难懂。那...

4379
来自专栏Netkiller

打破软件自动化测试的格局

打破软件自动化测试的格局 自动化测试的误区 自动化测试仅仅被认为是替代人工,所以我们看到很多企业实施自动化测试仅仅是将现有的 Test Case 转换成自动化脚...

4085
来自专栏IT大咖说

Web持续集成工作实践

摘要 如果团队开发成员经常集成他们的工作,每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建来验证,从而尽快地发现集成错误。...

4276
来自专栏情醉中国风

基于云安全环境的最佳实践

无论您是打算使用托管服务来处理你们组织的云安全,还是决定创建管理自己的安全项目,至少,将所需的所有信息汇总起来就可能是一项复杂的任务了。为了解决这个问题,我们想...

2349
来自专栏数据科学与人工智能

【Python环境】Scikit-Learn:开源的机器学习Python模块

scikit-learn是一个用于机器学习的 Python 模块,建立在SciPy基础之上,获得3-Clause BSD 开源许可证。这个项目是由 David ...

25810
来自专栏娱乐心理测试

IOS 上传到后台json数据

1663
来自专栏知晓程序

微信小程序公测了!如何第一时间注册?

1423
来自专栏小白课代表

Altium Designer 17 安装教程

1603
来自专栏用户画像

6.3.3 异步定时方式

在异步定时方式中,没有统一的时钟,也没有固定的时间间隔,完全依靠双方相互制约的“握手”信号来实现定时控制。通常,把交换信息的两个部件或设备分为主设备和从设备。主...

1093

扫码关注云+社区

领取腾讯云代金券