专栏首页K8S疑难杂症云原生监控实践(1)TKE集群中守护进程的监控采集
原创

云原生监控实践(1)TKE集群中守护进程的监控采集

在TKE集群中,有些组件是以daemonSet或者二进制的方式运行在集群中的节点上,作为了节点上的守护进程。对于这类组件的监控采集,也是支持接入到TKE的云原生监控中。接下来以Docker Daemon为例来描述下接入方案。

Docker Daemon以二进制文件的方式(或者systemd 服务的方式)直接运行在集群中的节点上,提供容器相关操作的底层支持。

Docker Daemon本身也有暴露出一些监控指标,并且支持接入promethues。

云原生监控

云原生监控的数据采集配置支持了三个配置入口:ServiceMonitor、PodMonitor、RawJob,其中ServiceMonitor、PodMonitor属于promethues operator中的CRD资源;而RawJob,则是指具体的原生的scrape config配置。

本文描述的Docker Daemon的监控采集也主要是基于云原生监控的RawJob配置入口来实现。

采集方案

方案架构图

1 通过新增RawJob配置,应用到云原生监控,来采集TKE集群中节点上的docker daemon的监控。

2 云原生监控通过k8s服务发现配置(kubernetes_sd_config)自动从TKE集群同步所有的node实例,并作为当前RawJob的target实例。

实施步骤

1 配置node节点上的Docker daemon配置文件,开启metrics

{
  "metrics-addr" : "0.0.0.0:9323",
  "experimental" : true
}

2 配置RawJob

scrape_configs:
- job_name: docker-daemon
  honor_timestamps: true
  metrics_path: /metrics
  scheme: http
  kubernetes_sd_configs:
  - role: node
  relabel_configs:
  - separator: ;
    regex: __meta_kubernetes_node_label_(.+)
    replacement: $1
    action: labelmap
  - source_labels: [__address__]
    separator: ;
    regex: ([^:;]+):(\d+)
    target_label: __address__
    replacement: ${1}:9323
    action: replace

配置好RawJob之后,可以在"查看Target"页面,查看Target的状态。

grafana面板配置

当配置好RawJob之后,我们就可以配置下grafana面板来直观地展示Docker Daemon的运行情况。

举例:Docker Daemon处于不同状态的容器数目统计:

image.png

参考文档:

https://www.cnblogs.com/tencent-cloud-native/p/14175775.html

https://docs.docker.com/config/daemon/prometheus/

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 云原生监控实践(2)TKE集群外组件的监控采集

    在系列文章(1)中,实现了用云原生监控采集TKE集群中节点上守护进程的监控指标。接下来,进一步描述下如何用云原生监控来采集TKE集群外组件的监控指标,比如Kon...

    keke.
  • 11月容器技术产品月报 | 云原生监控正式公测

    ? 2020年11月 ? ? VOL:07 ? ? ? ? 腾小云告诉你最前线的产品新特性, 总有一款让你心动~ ? 云说新品 ? 容器产品新特性 11月上新...

    腾讯云原生
  • 7月腾讯云容器产品技术月报 | 多款产品首秀

    腾讯云服务网格Tencent Cloud Mesh,是一致、可靠、透明的云原生服务通信网络管控基础平台。基于Istio,TCM与腾讯云基础设施原生集成,提供云原...

    腾讯云原生
  • 如何构建万级Kubernetes集群场景下的etcd监控平台?

    周成,腾讯云工程师,主要负责腾讯 etcd 监控平台设计、开发、运维工作,具备大规模 Kubernetes 和 etcd 集群运维开发经验。 唐聪,腾讯云资深...

    腾讯云原生
  • Kubernetes 降本增效标准指南 | 基于K8s 扩展机制构建云上成本控制系统

    Kubernetes 作为 IaaS 和 PaaS 中间的一层,通过声明式 API/控制器模式、以应用服务为中心、并且从API到运行时都提供了高度灵活的可扩展机...

    腾讯云原生
  • 1月容器技术产品月报 | 留言有奖

    ? 2021年1月 ? ? VOL:09 ? ? ? ? 腾小云告诉你最前线的产品新特性, 总有一款让你心动~ ? 云说新品 ? 容器产品新特性 12月上新 ...

    腾讯云原生
  • 如何扩展单个Prometheus实现近万Kubernetes集群监控?

    作者黄雷,腾讯云工程师,曾负责构建腾讯云云监控新一代多维业务监控系统,擅长大规模分布式监控系统设计,对golang后台项目架构设计有较深理解,后加入TKE团队...

    腾讯云原生
  • 云原生应用安全落地,你需要了解的容器安全体系

    guolong,云鼎实验室高级研究员,负责云原生安全的研究和腾讯云原生安全架构设计和落地实施。 摘要 容器安全作为云原生安全的重要组成部分,为用户业务的云原...

    腾讯云原生
  • 中秋福利 | 15个系列100+篇超实用云原生原创干货合集(内含腾讯彩蛋)

    还有2天,就要迎来中秋小长假啦 这个中秋节你打算怎么过? ? 小云选择把这篇干货全部拿下! 云原生技术干货文章合集,来咯~ ? 2021 年,要说咱们技术圈...

    腾讯云原生
  • 开工必备!50+篇超实用云原生技术干货合集

    kai 开 gong 工 da 大 ji 吉 新年新气象,更要1G棒 2020年没写完的代码,现在还有思路吗? 2021年开始使用云原生技术了吗? 一开工就遇...

    腾讯云原生
  • 8月腾讯云容器产品技术月报|留言抢腾讯定制T恤

    ? 2021年8月 ? ? VOL:16 ? ? ? ? 腾小云告诉你最前线的产品新特性 总有一款让你心动~ ? 云说新品 ? 容器产品新特性 8月上新 ? ...

    腾讯云原生
  • 云原生监控配置自建alertmanager实现告警

    当前k8s的主流监控软件主要是prometheus,为了能够更好的监控腾讯云上的tke集群,腾讯云也推出了prometheus的服务,叫做云原生监控,云原生监控...

    聂伟星
  • 云原生时代,腾讯如何做好容器安全体系建设?

    guolong,云鼎实验室高级研究员,负责云原生安全的研究和腾讯云原生安全架构设计和落地实施。 摘要 容器安全作为云原生安全的重要组成部分,为用户业务的云原...

    云鼎实验室
  • 云原生应用安全落地,你需要了解的容器安全体系

    guolong,云鼎实验室高级研究员,负责云原生安全的研究和腾讯云原生安全架构设计和落地实施。

    CNCF
  • 腾讯云原生支撑起14亿人项目背后的技术揭秘

    ? 简述 从 2020 年 11 月 1 日开始,第七次全国人口普查工作进入到正式登记阶段,700 万普查员走街串巷,他们需要在 15 天内,对近 14 亿人...

    腾讯云原生
  • 转发有礼 | 50篇+云原生系列干货文章汇总,请查收!

    云原生技术干货文章合集,来咯~ ? 2020 年,要说咱们技术圈子里什么最火? 云原生肯定是那 NO.1 ? 截止目前,我们不难看出,K8s 容器、服务...

    腾讯云原生
  • 打造云原生大型分布式监控系统(四): Kvass+Thanos 监控超大规模容器集群

    roc,腾讯高级工程师,Kubernetes Contributor,热爱开源,专注云原生领域。目前主要负责腾讯云TKE 的售中、售后的技术支持,根据客户需求...

    腾讯云原生
  • 3月容器产品技术月报|留言抢定制款T恤

    ? 2021年3月 ? ? VOL:11 ? ? ? ? 腾小云告诉你最前线的产品新特性, 总有一款让你心动~ ? 云说新品 ? 容器产品新特性 3月上新 ?...

    腾讯云原生
  • 【云+社区年度征文】TKE实战排错

    公司企业面对不断变化的用户需求,对于应用的快速开发上线提出了新的挑战,一方面在功能性能方面要求越来越高,另一方面对安全性、稳定性、高可用性、可扩展性也越来越苛刻...

    KaliArch

扫码关注云+社区

领取腾讯云代金券