首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【云原生】Grafana Alerting 告警模块介绍与实战操作

一、概述

在版本4.0+ grafana中增加了Alerting 告警模块,丰富了grafana功能,以前告警需要借助AlertManager,但是有grafana告警模块之后就可以不使用AlertManager告警了,但是grafana也支持对接AlertManager,所以还是非常方面,又可以省区一个组件的维护和资源开销。

下图概述了 Grafana 告警的工作原理,并向您介绍了一些关键概念,这些概念协同工作并构成了我们灵活而强大的警报引擎的核心。

特征:

一页包含所有警报:单个 Grafana 警报页面将 Grafana 管理的警报和驻留在与 Prometheus 兼容的数据源中的警报整合到一个位置。

多维度告警:警报规则可以为每个警报规则创建多个单独的警报实例(称为多维警报),使你能够强大而灵活地通过单个警报来了解整个系统。

路由警报:根据您定义的标签将每个警报实例路由到特定的联系点。通知策略是一组规则,用于将警报路由到联系点的位置、时间和方式。

抑制告警:抑制告警允许您停止接收来自一个或多个警报规则的持久通知。您还可以根据特定条件部分暂停警报。

抑制告警时间段:使用抑制告警时间段设置,您可以指定不希望生成或发送新通知的时间间隔。您还可以将警报通知冻结在重复时间段内,例如在维护期间。

告警配置全过程如下图:

二、Grafana Alerting 模块介绍

Alert rules(告警规则)——设置确定是否触发警报实例的评估条件。告警规则由一个或多个查询和表达式、条件、计算频率以及满足条件的持续时间(可选)组成。

Contact points(联络点即告警通道)——定义在警报触发时如何通知联系人。我们支持多种 告警通道,例如:邮件、webhook、alertmanager、钉钉等等。

Notification policies(通知策略)——设置警报的路由位置、时间和方式。每个通知策略指定一组标签匹配器,以指示它们负责哪些警报。通知策略分配有一个由一个或多个通知程序组成的联系点。

Silences(告警抑制)——可以设置某个时间段不告警,例如:系统升级或者阶段。

三、配置图表

图表配置可以参考我这篇文章:【云原生】Grafana 介绍与实战操作

四、告警告警规则

进入编辑界面,可以是下图进入编辑界面,也可以通过快捷方式“选中图表-》按”

配置相关信息

配置link,可以在告警里显示,就可以跳转到相关监控项图表

告警状态变化-》-》

五、配置告警通道(Contact points)

1)Email

1、配置smtp(grafana.ini)

【温馨提示】上面配置记得换成自己的邮箱密码。

重启grafana

2、配置消息模板

3、配置告警通道

上面配置好后就等待着告警就ok了。告警信息示例如下:

2)WebHook

告警示例 JSON:

这里通过python的去写webhook,因为条件有限,还是通过webhook转到邮箱发告警,一般企业会通过webhook转钉钉,微信,zabbix等等。

1、编写webhook api服务

【温馨提示】使用时注意把上面的邮箱和密码修改哦!!!

2、在grafana页面上配置

配置好后就可以等待告警,告警示例如下:

3)Alertmanager

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230328A000YW00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券