前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【TKE】 配置事件告警实践

【TKE】 配置事件告警实践

原创
作者头像
Jokey
修改2023-02-21 11:59:51
6270
修改2023-02-21 11:59:51
举报
文章被收录于专栏:云原生搬运工云原生搬运工

操作场景

对集群中比较关注的事件信息设置告警,以便快速感知该事件发生情况。

操作步骤

  1. 事件告警依赖 CLS 日志告警功能,所以需要先开启集群事件存储,参考 开启事件存储

2. 选择导航栏左侧运维中心 > 日志管理 > 事件日志,进入“事件检索”页面。通过事件仪表盘检索已有的事件样例,参考 全局检索

比如我们要想告警原因为 "NotTriggerScaleUp"(Pod Pending 没有触发节点池扩容事件) 的事件数量告警 ,我们可以在 交互模式 下, 添加筛选条件 event.reason 为 "NotTriggerScaleUp" 的事件信息。再使用 SQL 语句 统计查到的总条数,点击查询按钮查询相关事件信息(查询时间默认近15分钟,可以根据情况选择查询时间),如下图:

检索查询事件
检索查询事件

查询到事件后可以点击 统计图表 查看统计情况(如下图), 可以看到查询的事件总数为 15 个。

切换交互模式为语句模式,将显示查询的语句(留作备用): event.reason:"NotTriggerScaleUp" | select count(*) as errcounts,如下图:

查看查询语句
查看查询语句

3. 在 CLS 告警策略 界面设置告警配置。

根据第 2 步生成的查询语句创建告警配置,如下图:

配置告警
配置告警

触发条件语法参考:触发条件语法

4. 根据帮助文档配置告警对象相关信息后保存,如下图:

配置告警对象
配置告警对象

上述第3、4步配置详情和告警测试请参考 CLS 监控告警文档。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 操作场景
  • 操作步骤
相关产品与服务
日志服务
日志服务(Cloud Log Service,CLS)是腾讯云提供的一站式日志服务平台,提供了从日志采集、日志存储到日志检索,图表分析、监控告警、日志投递等多项服务,协助用户通过日志来解决业务运维、服务监控、日志审计等场景问题。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档