专栏首页敏而好学k8s node alertmanager监控报警配置方法

k8s node alertmanager监控报警配置方法

概述

节点本身的监控主要监控CPU、内存、磁盘IO、文件系统可用空间即可。 比如,对于使用来prometheus的alertmanager来做node报警,rules配置可以参考如下点进行配置即可。

说明

不同的node-exporter版本,对应的metrics也不一样,需要自己对照更改一下。

CPU监控

(1 - avg(irate(node_cpu{mode="idle"}[10m])) by (instance)) * 100 < 90

内存监控

((node_memory_MemTotal - node_memory_MemFree) / node_memory_MemTotal) * 100 < 90

磁盘IO监控

(max(avg(irate(node_disk_io_time_ms[10m])) by (instance, device)) by (instance))/10

文件系统可用空间监控

max(((node_filesystem_size{fstype=~"ext4|vfat"} - node_filesystem_free{fstype=~"ext4|vfat"}) / node_filesystem_size{fstype=~"ext4|vfat"}) * 100) by (instance) > 90

参考:https://www.dogsbodytechnology.com/blog/turning-prometheus-data-into-metrics-for-alerting/

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • SMF服务管理 和 FMA故障管理 常用操作

    $ svcs -a        # 显示所有服务的状态,既显示已禁用的服务又显示已启用的服务

    党志强
  • GlusterFS客户端进程分析

    16683 root      20   0  398m  16m 2796 S  0.0  0.2   2:31.58 /usr/sbin/glusterd ...

    党志强
  • Intel与ARM处理器对比分析

    复杂指令集比精简指令集的实现要多用很多晶体管,导致复杂指令集架构天生比精简指令集架构更复杂、功耗更大。

    党志强
  • 搭建 ElasticSearch 2.4.6分布式集群

    选取10.90.4.9这台机器做为client node,elasticsearch.yml中的配置如下:

    試毅-思伟
  • winform如何保持TreeView节点展开和折叠的状态

    转载:http://blog.sina.com.cn/s/blog_6abcacf5010138q5.html

    跟着阿笨一起玩NET
  • 二叉查找树

    二叉查找树是一种数据结构,它是具有以下性质的二叉树: 1.若左子树不空,则左子树上所有结点的值均小于或等于它的根结点的值; 2.若右子数不空,则右子树上所有...

    小飞侠xp
  • JOJ 2676 Problem B

    题意:给三个点abc的坐标构成三角形,在三角形内部找到一点,促使a所对应的边构成的三角形占总 三角形面积的1/2,c点对应的边构成的三角形占总三角形面积的1/6...

    用户1624346
  • HDU 1199 Color the Ball

    Color the Ball Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32...

    ShenduCC
  • hdu1009

    @坤的
  • jQuery动画与ajax

    小胖

扫码关注云+社区

领取腾讯云代金券