前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Ops实践 | 云原生Prometheus监控之企业网站指标采集预警及可视化大盘展示

Ops实践 | 云原生Prometheus监控之企业网站指标采集预警及可视化大盘展示

作者头像
全栈工程师修炼指南
发布2023-11-17 16:17:16
1680
发布2023-11-17 16:17:16
举报

微信改版了,现在看到我们全凭缘分,为了不错过【全栈工程师修炼指南】重要内容及福利,大家记得按照上方步骤设置「接收文章推送」哦~



前言简述:

从本章开始,作者将主要针对企业中主机系统(Linux、Windows)、K8S集群节点与Pod、网站服务(http、dns)、数据库、网络安全设备进行指标采集与监控预警进行实践记录,我将从基础环境安装,到目标对象的监控,以及目标监控指标的可视化展示和目标预警规则的设置几方面入手。 让看友可以更随着我快速的进行实践操作,为数字企业转型舔砖加瓦,全面迎接云原生环境下的企业内部监控预警和展示,至此也希望大家多多支持此《#云原生落地实用指南》专栏,作者将会持续更新云原生下Prometheus的监控和等保下企业内部日志收集实践,我相信你看了此系列专栏必定会有所收获。

此篇文章,将开始主要讲解云原生环境下,如何使用Prometheus监控之blackbox_exporter导出器,来采集企业内部或者外部的业务系统站点以及网站证书过期时间,然后编写预警规则,并使用Altermanager进行告警通知,废话不多说,实践出真知。,废话不多说,实践出真知。

实践效果:

图1.blackbox 导出器采集监控目标

图2..blackbox 导出器采集指标可视化展示

图3.blackbox 导出器采集指标告警规则

图4.使用Altermanager针对采集指标进行告警


文章目录:


blackbox_exporter - 黑盒导出器

描述: blackbox 导出器允许通过HTTP/HTTPS(网站可用性)、DNS(域名解析)、TCP(端口存活)、ICMP(主机存活检测)和gRPC对端点进行黑盒探测。

项目地址: https://github.com/prometheus/blackbox_exporter

温馨提示:blackbox_exporter 通常有两种安装方式,方式一是通过系统的systemd进行管理使用(文章末尾附上安装脚本),方式二是通过容器进行安装使用。

由于此处我们主要是在云原生的K8S环境中,所以此处作者选用后者进行演示,注意此处是在上一篇文章《Ops实践 | 从零开始,搭建云原生环境下企业监控预警可视化平台》基础之上进行的,所以请还没有配置相关环境的童鞋再参考一下。

目标对象监控

操作步骤:

  • Step 1.安装前置准备工作。
代码语言:javascript
复制
# 创建相关配置目录
mkdir -vp /storage/app/monitoring/blackbox_exporter
mkdir -vp /storage/app/monitoring/prometheus/exporter

# 拉取
docker pull quay.io/prometheus/blackbox-exporter:latest
docker tag quay.io/prometheus/blackbox-exporter:latest harbor.cloud/weiyigeek/blackbox-exporter:20231108

# 上传
docker push harbor.cloud/weiyigeek/blackbox-exporter:20231108
  • Step 2.创建 blackbox_exporter 相关模块配置文件, 可以使用icmp、tcp、grpc、dns、http/https(get|post)以及http_oauth_client_credentials 等相关操作。
代码语言:javascript
复制
tee /storage/app/monitoring/blackbox_exporter/blackbox.yaml <<'EOF'
modules:
  icmp:
    prober: icmp
    timeout: 5s
    icmp:
      preferred_ip_protocol: "ip4"
  tcp:
    prober: tcp
    timeout: 5s
  tcp_tls:
    prober: tcp
    timeout: 5s
    tcp:
      tls: true
  grpc:
    prober: grpc
    grpc:
      tls: true
      preferred_ip_protocol: "ip4"
  dns:
    prober: dns
    timeout: 5s
    dns:
      query_name: "www.weiyigeek.top"
      query_type: "A"
      valid_rcodes:
        - NOERROR
  http_get:
    prober: http
    timeout: 5s
    http:
      valid_http_versions: ["HTTP/1.1", "HTTP/2.0"]
      valid_status_codes: [200]
      method: GET
      headers:
        User-Agent: "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100101 Firefox/89.0"
      tls_config:
        insecure_skip_verify: false
      preferred_ip_protocol: "ip4"   # Defaults to "ip6"
  http_post:
    prober: http
    timeout: 5s
    http:
      valid_http_versions: ["HTTP/1.1", "HTTP/2.0"]
      valid_status_codes: [200]
      method: POST
      headers:
        User-Agent: "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100101 Firefox/89.0"
        Content-Type: application/json
      body: '{}'
      fail_if_not_ssl: false
      tls_config:
        insecure_skip_verify: false
      preferred_ip_protocol: "ip4"   # defaults to "ip6"
      ip_protocol_fallback: false    # no fallback to "ip6"
  http_basic_auth:
    prober: http
    timeout: 5s
    http:
      method: POST
      headers:
        Host: "login.weiyigeek.top"
      basic_auth:
        username: "username"
        password: "mysecret"
  http_oauth_client_credentials:
    prober: http
    timeout: 5s
    http:
      valid_http_versions: ["HTTP/1.1", "HTTP/2"]
      follow_redirects: true
      preferred_ip_protocol: "ip4"
      valid_status_codes:
        - 200
        - 201
      oauth2:
        client_id: "client_id"
        client_secret: "client_secret"
        token_url: "https://api.weiyigeek.top/token"
        endpoint_params:
          grant_type: "client_credentials"
EOF
  • Step 3.创建部署blackbox的deployment资源清单文件
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-11-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 全栈工程师修炼指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • blackbox_exporter - 黑盒导出器
    • 目标对象监控
    相关产品与服务
    容器服务
    腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档