前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Prometheus服务监控进阶

Prometheus服务监控进阶

作者头像
用户5521279
发布2019-08-02 14:37:06
1.6K0
发布2019-08-02 14:37:06
举报
文章被收录于专栏:搜狗测试搜狗测试

一、背景介绍 上回分享的《五分钟打造高逼格的监控系统》,我们成功搭建并初步介绍了Prometheus+NodeExporter+Grafana框架体系,本回开始给大家分享Prometheus服务监控2个核心的功能:

1、监控结果查询语言(PromQL)基础; 2、Prometheus服务告警系统; 对应下图右侧的:PromQL和Alertmanager模块。 PromQL语言是我们使用Prometheus的基础,Alertmanager告警系统是我们最常用的功能。

二、监控结果查询语言:PromQL PromQL (Prometheus Query Language) 是 Prometheus 自己开发的数据查询 DSL 语言,语言表现力非常丰富,内置函数很多,在日常数据可视化以及告警配置中都会使用到它。 1、介绍2个常用PromQL的地方:

  • Prometheus可视化查询页:
代码语言:javascript
复制
访问:http://你的Prometheus服务IP:9090/graph

我们可以看到如下页面,在第一个红框输入PromQL查询语句,点击"Execute"运行即可查看结果。我们也可以从"- insert metric at cursor -"直接选择常用的查询语句:

  • Grafana数据查询面板

如进入上次部署的看板结果页面,点击右上角按钮再添加一项可视化面板,选择"Add Query"进入查询页面:

2、介绍一些常用的PromQL语句:

代码语言:javascript
复制
# 1.查询http请求总数:

3、关于PromQL语言 PromQL语言具体语法与其他常用语言类似,这里不展开介绍,这里推荐2个学习的文档,可以一边学习一边实践: 英文版本:

代码语言:javascript
复制
https://prometheus.io/docs/prometheus/latest/querying/basics/

当然也给大家奉上中文版本:

代码语言:javascript
复制
https://love2.io/@1046102779/doc/prometheus/prometheus/querying/basics.md

三、Prometheus服务告警系统 作为一个监控系统,最重要的功能,还是应该能及时发现系统问题,并及时通知给系统负责人,这就是 Alerting(告警)。Prometheus 的告警功能被分成两部分:

  • 一个是告警规则的配置和检测(Prometheus),并将告警发送给 Alertmanager;
  • 另一个是Alertmanager,它负责管理这些告警,去除重复数据,分组,并路由到对应的接收方式,发出报警。

常见的接收方式有:邮件、企业微信、钉钉、Slack、WebHook等。

本文以邮件接收方式讲解告警系统的使用,其他告警接收方式配置可以依此举一反三,使用告警服务主要的步骤如下:

1、下载并配置 Alertmanager:

  • 下载
代码语言:javascript
复制
# 下载
  • 修改alertmanager.yml配置文件:
代码语言:javascript
复制
global:

2、在 Prometheus 服务中配置告警规则并监听Alertmanager:

  • 在Prometheus目录下新建告警配置规则文件:alert.rules.yml,在文件中编写告警规则:
代码语言:javascript
复制
ALERT memory_high
  • 在Prometheus规则里添加该告警规则:
代码语言:javascript
复制
# 在prometheus.yml文件rule_files节点添加加载刚才编写的规则:
  • 在Prometheus规则里添加与Alertmanager系统关联(监控):
代码语言:javascript
复制
alerting:

3、启动(或重新加载)Alertmanager和Prometheus服务:

代码语言:javascript
复制
# 启动Alertmanager

4、当系统触发了告警配置的规则时,我们会收到邮件通知。

四、写在最后 1、告警系统部署部分小编已经编写了自动化部署脚本,有需要的话可以关注【搜狗测试】公众号留言或添加下面官方微信号获取; 2、后续我们会在【搜狗测试】公众号持续分享Prometheus另外2大核心功能:Exporter实战和Pushgateway组件,敬请关注。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 搜狗测试 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档