01.
背景介绍
对于企业的生产环境而言,监控与报警不可或缺的,完善的监控与及时的报警和自动化处理,可以帮助企业快速定位并解决问题,从而减少经济损失。
腾讯云事件总线(EventBridge)是一款安全、稳定、高效的无服务器事件管理平台。事件中心的事件总线可以接收来自您自己的应用程序、软件即服务(SaaS)和腾讯云服务的实时事件及相关数据流,通过集成消息推送和 SCF 云函数,实现告警信息的实时通知和自动化处理。
本文以服务器异常为例,为您介绍当云服务器产生告警事件后,如何基于 EventBridge 事件总线和 SCF 云函数,实现告警消息的实时推送和硬盘快照的自动回滚,完成自动化运维架构的快速搭建。
02.
背景介绍
整体架构设计如图,从图上可以看出,当云服务器某台机器出现异常告警, CVM 会自动产生告警事件并主动推送给 EB,经过 EB 绑定的告警规则筛选后,完成到通知渠道的消息触达及时通知到用户,同时触发云函数,以调用 API 的方式完成硬盘快照的快速回滚,保证业务及时恢复。
03.
基本步骤
1. 登录云函数控制台新建云函数,通过调用 API 的方式,完成服务器故障后自动处理流程的函数代码编写
2. 登录 EventBridge 控制台,配置告警规则;
3. 以「云服务器运行异常」事件告警配置为例,您可以选择指定的事件告警类型,也可以选择全部告警事件,详细事件匹配规则请参见 管理事件规则;
4. 配置推送目标
为了满足自动化处理和消息推送两部分能力,对于上述规则,我们需要同时配置消息推送和云函数两个投递目标
5. 告警链路测试
配置完成后,回到事件集控制台,选择刚刚已绑定的事件集,单击发送事件,可以选择已绑定的事件规则模版,单击发送进行测试,如果同时收到了推送消息并自动进行回滚,即可确认您的业务故障自动化运维架构已完成搭建。
注:测试模版里只展示 data 字段里的内容,其它字段已固定,无法自定义修改。
识别下方 👇 二维码,进入「事件总线」交流群
推荐阅读
One More Thing
欢迎进入千人 QQ 群 (871445853) 交流 Serverless!
点击「阅读原文」,了解更多事件总线 EventBridge 应用场景。
本文分享自 ServerlessCloudNative 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!