前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >记录一次promehteus问题:组件运行正常,TargetDown。

记录一次promehteus问题:组件运行正常,TargetDown。

作者头像
云云众生s
发布2024-03-28 10:55:32
1210
发布2024-03-28 10:55:32
举报
文章被收录于专栏:云云众生s

现象:

详请

🚨 触发中告警 [1]

告警名称 : TargetDown 告警级别 : WARNING 实例 : “ 告警状态 : 🚨 FIRING 开始时间 : 2023-12-29T10:36:46Z 结束时间 : Not End 告警描述 : 33.33% of the kube-scheduler/prometheus-kube-prometheus-kube-scheduler targets in kube-system namespace are down.

登录master服务器检查端口监听正常。但登录Prometheus发现target处于DOWN的状态。并报错server returned HTTP status 401 Unauthor

检查apiserver日志发现有很多Unable to authenticate the request” err=”[x509: certificate has expired or is not yet 。

初步怀疑组件出问题,多次重启组建仍无法解决问题。

分析:

是因为集群证书更新了,然而使用kubectl delete pods方式 去重启组件是没生效的,需要通过docker restart 方式重启组件服务才行。

解决办法:

通过  docker ps  -a|egrep  “scheduler|kube-controller” 查看没有重启的次数,需要执行docker restart  容器id  。检查发现target恢复正常。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-01-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档