首页
学习
活动
专区
工具
TVP
发布

yeedomliu

专栏作者
379
文章
315008
阅读量
56
订阅数
一文了解Prometheus
监控服务主动拉取被监控服务的指标,被监控服务一般通过主动暴露metrics端口或者通过Exporter的方式暴露指标,监控服务依赖服务发现模块发现被监控服务,从而去定期的抓取指标
yeedomliu
2022-06-25
8000
Prometheus监控实战
2.3 Prometheus数据模型 2.3.1 指标名称 2.3.2 标签 2.3.3 采样数据 2.3.4 符号表示 2.3.5 保留时间
yeedomliu
2021-07-19
9.1K0
《Learning ELK Stack》前言
前言 随着云计算和大数据的发展,分布式架构已经成为常态。在分布式系统中,日志也随之分布到多台服务器上。这时候,要借助日志来排查系统问题,或者分析业务数据等,成本就比传统的单机系统要高很多 从大数据的角度来看,大数据的来源,主要包括 数据库 日志文件 爬虫 其中日志文件是最常见也是量最大的数据来源。爬虫也经常会将初步处理的数据以文件的形式存放,也可以归结到日志文件一类。解决日志文件的采集、解析和分析,也是大数据时代的普遍需求 所以,在云计算和大数据时代,将分布在多台服务器上的日志集中起来,统一地进行存储、解析
yeedomliu
2020-07-02
1960
《Prometheus监控实战》第12章 监控Kubernetes
第12章 监控Kubernetes 我们会把Tornado、Prometheus部署到Kubernetes集群中(https://github.com/turnbullpress/tornado-api) ---- 12.1 Kubernetes集群 Kubernetes集群名为tornado.quicknuke.com,使用kops构建了该集群(https://github.com/kubernetes/kops),可以在Github上找到集群配置。它有3个主节点和6个工作节点,所有节点都在三个可用区之间
yeedomliu
2019-12-19
2K0
《Prometheus监控实战》第11章 推送指标和Pushgateway
第11章 推送指标和Pushgateway 在某些情况下,没有可以从中抓取指标的目标。造成这种情况的原因有很多 安全性或连接性问题,使你无法访问目标资源。这是一种非常常见的情况,比如服务或应用程序仅允许特定端口或路径访问 目标资源的生命周期太短,例如容器的启动、执行和停止。在这种情况下,Prometheus作业将会发现目标已完成执行并且不再可以被抓取 目标资源没有可以抓取的端点,例如批处理作业。批处理作业不太可能具有可被抓取的HTTP服务,即使假设作业运行的时间足够长 在这些情况下,我们需要将时间序列传递或
yeedomliu
2019-12-19
4.5K0
《Prometheus监控实战》第10章 探针监控
第10章 探针监控 探针监控可以在应用程序的外部进行探测。你可以查询应用程序的外部特征:它是否响应开放端口上的轮询请求并返回正确的数据或响应码。探针监控的一个示例是执行ICMP ping或echo检查并确认你已收到响应。这种类型的探针监控也称为黑盒监控,因为我们将内部应用程序视为黑盒 ---- 10.1 探针架构 Prometheus通过运行Blackbox exporter来进行探测,该exporter会探测远程目标并暴露在本地端点上收集的任何时间序列,然后Prometheus作业将从这些端点中抓取指标
yeedomliu
2019-12-19
3.4K0
《Prometheus监控实战》第7章 可靠性和可扩展性
第7章 可靠性和可扩展性 分为两个问题进行考虑 可靠性和容错性 可扩展性 ---- 7.1 可靠性和容错性 通常的实现方式是构建集群。但是,集群解决方案需要相对复杂的网络,并且需要解决集群中节点之间的状态管理问题 Prometheus架构认为,实现集群所需的投入以及维护集群节点之间数据一致性的成本要高于数据本身的价值 Prometheus推荐的容错解决方案是并行运行两个配置相同的Prometheus服务器,并且这两个服务器同时处于活动状态。该配置生成的重复警报可以交由上游Alertmanager使用其分组(
yeedomliu
2019-12-19
1.2K0
《Prometheus监控实战》第4章 监控主机和容器
第4章 监控主机和容器 首先,我们将在每台主机上安装exporter,然后配置节点和Docker指标让Prometheus来抓取。基本主机资源监控 CPU 内存 磁盘 可用性 然后,我们利用收集的指标来构建一些聚合指标并保存为记录规则 最后,我们会简要介绍Grafana,并对收集的数据进行基本的可视化 回顾USE: 使用率(Utilization) 饱和度(Saturation) 错误(Error) USE方法可以概括为:针对每个资源,检查使用率、饱和度和错误。该方法对于监控那些受高使用率或饱和度的性能问题
yeedomliu
2019-12-19
5.1K0
《Prometheus监控实战》第2章 Prometheus简介
第2章 Prometheus简介 ---- 2.1 Prometheus起源 Prometheus的灵感来自谷歌的Borgmon。它最初由前谷歌SRE Matt T.Proud开发,并转为一个研究项目。在Proud加入SoundCloud之后,他与另一位工程师Julius Volz合作开发了Prometheus。后来其他开发人员陆续加入了这个项目,并在SoundCloud内部继续开发,最终于2015年1月将其发布 Facebook发现85%的查询是针对26小时内的数据 ---- 2.2 Prometheus
yeedomliu
2019-12-19
1.1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档