一旦业务出现故障,我们运维人员肯定需要第一时间介入处理,所以选择一个及时的通知软件是非常重要的。
自定义机器人:机器人
测试:
目前只有Graph支持报警功能,所以我们选择Graph相关图表。
我们切换到前面建过的dashboard面板,双击Memory点击Edit:
再来讲一下吧:
1、Alert名称,可以自定义。
2、执行的频率,这里我选择每60s检测一次。
3、判断标准,默认是avg,这里是下拉框,自己按需求选择。
4、query(A,5m,now),字母A代表选择的metrics中设置的sql,也可以选择其它在metrics中设置的,但这里是单选。5m代表从现在起往之前的五分钟,即5m之前的那个点为时间的起始点,now为时间的结束点,此外这里可以自己手动输入时间。
5、设置的预警临界点,这里手动输入,和6是同样功能,6可以手动移动,两种操作是等同的。
警报发送的是一个URL地址,这里需要注意一下,需要修改
vim /etc/grafana/grafana.ini
中的一个参数:
root_url = http://grafana.zhdya.com
保存报警配置,否则无法测试: