前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >20.23/20.24/20.25 告警系统邮件引擎

20.23/20.24/20.25 告警系统邮件引擎

作者头像
运维小白
发布2022-01-06 14:09:59
3440
发布2022-01-06 14:09:59
举报
文章被收录于专栏:运维小白运维小白运维小白

告警系统邮件引擎

  • 因为之前做zabbix的时候,做过mail.py的脚本,在这里,直接调用进行使用就可以。
  • 但是告警邮件引擎核心,conf主配置文件调用到的都是mail.sh ,所以这里需要定义调用mail.py的sh脚本
  • mail.sh目的是做告警收敛,如果不想做告警收敛,在发现问题的时候直接告警就好,但是,可能会发生1分钟前发现问题,1分钟户问题解决,这样就会变成误报,这样会很麻烦
  • 收敛的目的就是1分钟前发现问题,然后到10分钟后,服务还没有恢复,就会告诉管理人员10分钟了服务还未恢复
  • mail.sh内容 //其中mail.py内容
#!/bin/bahs

log=$1   
t_s=`date +%s`
t_s2=`date -d "2 hours ago" +%s`  //定义2个小时的时间戳
#日志不存在就创建日志
if [ ! -f /tmp/$log ]
then
    echo $t_s2 > /tmp/$log
fi

#下面这段,等同于一个计时器

t_s2=`tail -1 /tmp/$log|awk '{print $1}'`
echo $t_s>>/tmp/$log
v=$[$t_s-$t_s2]   //时间戳对比
echo $v

#当故障存在3600秒,就会进行告警

if [ $v -gt 3600 ]
then
    ./mail.py  $1  $2  $3
    echo "0" > /tmp/$log.txt  //等同于计数器
else
    if [ ! -f /tmp/$log.txt ]
    then
        echo "0" > /tmp/$log.txt
    fi
    nu=`cat /tmp/$log.txt`
    nu2=$[$nu+1]
    echo $nu2>/tmp/$log.txt
    if [ $nu2 -gt 10 ]
    then
         ./mail.py  $1 "trouble continue 10 min $2" "$3"
         echo "0" > /tmp/$log.txt   //邮件告警结束以后,重新开始计数
    fi
fi  
  • 该脚本运用于,间隔3600 故障;10分钟内故障;间歇性故障;
  • 核心判断:计时、计数
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018/02/07 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 告警系统邮件引擎
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档