学习
实践
活动
专区
工具
TVP
写文章

监控利器Prometheus】——Prometheus+Grafana监控SpringBoot项目业务指标监控

Prometheus+Grafana监控SpringBoot项目业务指标监控 1、SpringBoot项目配置 2、prometheus添加配置 3、Grafana配置 1、SpringBoot项目配置 项目并访问几次下单接口(目的是为了造点埋点数据),在 http://localhost:6002/actuator/prometheus 页面可以看到在上面 OrderServiceImpl 中添加的统计指标 在Prometheus UI界面通过PromeSQL查询统计指标的数据: (1)查询【创建订单数量】统计数据 (2)查询【创建订单金额】统计数据 以上数据在重启SpringBoot项目后,就会丢失 保存 (2)订单金额统计 按照同样的方式添加统计订单金额的pannel,需要注意的是,DistributionSummary定义的指标,在prometheus中会加个后缀,比如上面定义的 DistributionSummary 的 name 为 “order_amount”,在prometheus收集时会有“order_amount_sum”、“order_amount_count”、“order_amount_max”多个指标

25820

微博基于ClickHouse灵活监控百亿流量下的业务指标

目前负责微博广告业务可用性的保障与优化、资源利用率的提升、监控报警系统的建设以及自动化体系的推进。 同时,随着微博广告流量的日益增长,微博广告监控指标越来越多,我们的监控指标引擎承载的压力也越来越大。 那么,在这些复杂多变的流量洪峰下,如何更灵活快速地去查看我们的系统指标性能呢? 这里假设您已经拥有了一个高可用的分布式 ClickHouse 集群,下面我将通过三个业务监控需求用例,来为您介绍在微博广告业务百亿流量下,我们如何通过 ClickHouse 的数据抽样和物化视图功能,来快速灵活地可视化我们的监控指标 分主机 QPS 监控图效果如下: ? 四、请求量的日环比和周同比监控 在微博广告的监控需求中,经常需要对一些指标进行历史走势对比监控,如下图所示: ? 当我们面对一个复杂的系统,我们依然可以从容的展示系统内部各个环节的性能和业务指标

1.7K20
  • 广告
    关闭

    新年·上云精选

    热卖云产品年终特惠,2核2G轻量应用服务器7.33元/月起,更多上云必备产品助力您轻松上云

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    监控体系建设(二):监控指标

    (接监控体系建设(一)监控体系分层与整合) 三、 监控指标 如前一章提到,监控有赖于运维各专业条线协同完善,通过将监控体系进行分层、分类,各专业条线再去有重点的丰富监控指标。 500,登录成功率96%”,由于登录成功率并未明显下降,可能是由于业务作了业务推广,运维人员只需关注当前应用运行状态再做判断;预警代表监控事件需要运维人员处理,但重要性略低,比如“CPU使用率71%,增长趋势非突增 (三)指标基线 当前运行状况是否正常需要用运行情况与阀值作比较,但实际实施过程中会发现一个固定的阀值会导致不少监控误报,比如业务运营大促与非运营活动日、非工作日与工作日、白天与晚上的运行值都会有不小的差异 指标基线的建设过程中有几个方面需要关注: -基线的自我学习: 前面己提到指标的基线是动态的,基线动态就需要对系统运行的情况按一个指定的时间间隔粒度进行学习,理论上运行学习的时间越长,基线越准确(但如果业务做了推广 -基线的人工调整: 系统运行过程中难免会因为业务运营推广等导致历史基线不能反映指标是否合理,这时候需要有一个人工调整基线的入口,运维人员可以重新绘制基线、减少对历史数据的参考权重等。

    2.7K20

    Elasticsearch 监控指标解析

    1.集群监控 集群监控主要包括两个方面的内容,分别是集群健康情况和集群的运行状态。 集群健康状态可以通过以下api获取: http://ip:9200/_cluster/health? 2.节点监控 节点监控主要针对各个节点,有很多指标对于保证ES集群的稳定运行非常重要。 可以通过以下api获取: http://ip:9200/_nodes/stats? 一些需要计算的指标: 节点监控的计算指标主要分为两类,分别为请求速率指标和请求处理延迟指标,下面作具体介绍。 1index_per_min: 2#每分钟索引请求数量。 3.索引监控 索引监控指标主要针对单个索引,不过也可以通过“_all”对集群中所有索引进行监控。 节点监控指标可以通过以下api获取: http://ip:9200/_stats? 理解了上面的指标 就可以使用Prometheus和Grafana进行监控展示 下面是我们测试环境的Grafana上展示的Elasticsearch集群的状态 可以看到prometheus采集到的的指标信息还是比较全面的

    88940

    监控体系的核心指标

    获得这种洞察力的最佳方法之一是使用强大的监控系统,该系统可以收集指标、可视化数据并在出现问题时提醒操作员。 在我们对指标监控和警报指南的介绍中,我们讨论了一些涉及监控软件和基础设施的核心概念。 指标监控系统处理的主要材料,用于构建被跟踪系统的内聚视图。了解哪些组件值得监控以及您应该查看哪些具体特征是设计一个系统的第一步,该系统可以提供有关您的软件和硬件状态的可靠、可操作的见解。 监控的黄金信号 在极具影响力的 Google SRE(站点可靠性工程)书中,关于监控分布式系统的章节介绍了一个有用的框架,称为监控的四个黄金信号,它代表了在面向用户的系统中要衡量的最重要的因素。 为单个服务器组件收集的指标 需要收集的基本级别指标是与您的系统所依赖的底层计算机相关的指标。 强大的监控可以帮助减轻处理不太可靠的通信渠道的一些困难。 除了网络本身,对于分布式服务,服务器组的健康和性能比应用于任何单个主机的相同措施更重要。

    18030

    SpringBoot2---指标监控

    指标监控 1、SpringBoot Actuator 1、简介 2、1.x与2.x的不同 3、如何使用 2、Actuator Endpoint 1、最常使用的端点 最常用的Endpoint 2、Health :实现抽象类 设置为总是显示详细信息 2、定制info信息---用于展示当前应用详细信息 方式一: 编写配置文件 方式二: 编写InfoContributor 3、定制Metrics信息 (运行时指标 ---- 2、Actuator Endpoint 1、最常使用的端点 最常用的Endpoint Health:监控状况 Metrics:运行时指标 Loggers:日志记录 ---- 2、Health 整个就是宕机状态) 很多的健康检查默认已经自动配置好了,比如:数据库、redis等 可以很容易的添加自定义的健康检查机制 ---- 3、Metrics Endpoint 提供详细的、层级的、空间指标信息 Collections.singletonMap("key", "value")); } } 会输出以上方式返回的所有info信息,即配置文件和代码迭代的所有info信息 ---- 3、定制Metrics信息 (运行时指标

    22930

    Linux 常用监控指标总结

    所以,依靠强大的监控系统,收集尽可能多的指标,意义重大。但哪些指标才是有意义的呢,本着从实践中来的思想,各位工程师在长期摸爬滚打中总结出来的经验最有价值。 关键业务进程资源消耗 NTP offset采集 DNS解析采集 每个类别,具体的详细指标如下,这些指标,都是open-falcon的agent组件直接支持的。 falcon-agent每隔一定时间间隔(目前是60秒)会采集一次相关的指标,并汇报给server端。 2. 分区读写监控 测试所有已挂载分区是否可读写,每个metric都会有一组tag描述,表示挂载点,比如mount=/home sys.disk.rw:如果值不为0,表明此分区读写出现问题 7. 进程资源监控 process.cpu.all:进程和它的子进程使用的sys+user的cpu,单位是jiffies process.cpu.sys:进程和它的子进程使用的sys cpu,单位是jiffies

    1K30

    zabbix监控哪些指标_zabbix监控爱快

    今天我们来聊聊,面试中那些高频的问题, 比如zabbix你都监控哪些参数。 一. 原理解释 说到监控,在运维这个行业其实有很多开源的监控方案,目前最常见的就是zabbix+grafana, 我工作那时候还是用cacti和nagios的比较多。 而我们要监控的也无非是5大块,服务器,中间件,数据库,网络设备,应用。 二. 监控指标举例 1. 监控web服务 web服务是否正常 业务(网页是否能访问、是否可以完成下订单、注册用户) 服务的响应时间 服务的并发量(活动用户、非活动用户) 2. 监控数据库 监控磁盘使用情况 监控内存内存使用 查看并发连接数量 检查数据库执行增删改查的频率 版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。

    13910

    nginx 监控指标及收集

    监控的主要指标 一般来说,我们需要对三个主要的指标进行监控: 1. 基本活跃指标 2. 错误指标 3. 性能指标 2.1. 基本活跃指标 下图显示了 nginx 收集的基本指标。 nginx 监控基本活跃指标 名称 描述 是否累加历史数据 Accepts(接受) NGINX 接受的客户端连接数(包括 Handled + Dropped + Waiting) 是 Handled(已处理 指标的收集 介绍了这么多的监控指标,事实上,上面介绍的仅仅是基本的监控指标,针对实际的情况,还有很多指标十分具有监控的必要。 那么,怎么去收集这些指标进行监控呢? 3.1. ngx_http_stub_status_module 通过在编译时加入 nginx 的 ngx_http_stub_status_module 我们可以实时监控以下基本的指标: 1. 3.2. nginx plus — ngx_http_status_module 商业版的 nginx plus 通过他的 ngx_http_status_module 提供了比 nginx 更多的监控指标

    1.1K30

    Prometheus监控运维实战十: 主机监控指标

    在上一篇文章中我们学习了如何通过node-exporter获取主机监控信息。但安装好监控只是第一步,我们还需要知道哪些监控指标是我们需要关注的。 本文将对Prometheus相关的主机监控指标进行介绍。 一. 网络监控 网卡流量 网卡流量一般分为上传和下载流量,下面两个指标分别为总的字节数,可通过这两个指标计算出来网卡每秒流量 node_network_receive_bytes_total #下载流量总字节数 可用性监控 除了监控主机的性能参数外,我们还需要关注实例的可用性情况,比如是否关机、exporter是否正常运行等。在exporter返回的指标,有一个up指标,可用来实现这类监控需求。 本文讲解的内容只是主机监控中的基本指标,node-exporter自身还提供不少有用的指标,包括支持textfile的自定义指标。在生产环境中,需要根据实际情况进行调试。

    32910

    指标&监控&告警入门详解(二)

    由于系统通常是分层运行的,在更原始的基础设施之上会构建更复杂的层,因此在计划监控策略时,按层级式考虑指标会大有裨益。 01 基于主机的指标指标层次结构的最底层是基于主机的指标。 05 外部依赖指标 你可能还希望将一些和外部依赖性相关的指标添加进监控系统中。 请记住,最高层级中最有价值的指标可能是较低层级中提供的资源。 影响选择监控指标的因素 理想情况中,最好能从一开始就监控和系统相关的所有事情。但是,有很多原因导致这种状态几乎不可能实现。 部署环境:尽管稳健的监控系统对于生产系统最重要,但部署和测试系统也可以从监控中受益,尽管严重性、粒度和所衡量的总体指标可能有所不同。 未完待续,预告: 系列(三):指标 & 监控 & 告警系统的重要特质 推荐阅读:指标&监控&告警入门详解(一) 欢迎联系云监控小助手微信号,加群讨论:) ?

    45220

    Kubernetes相关组件监控指标采集

    线上部署了kuberneter集群环境,需要在zabbix上对相关组件运行情况进行监控。kuberneter组件监控指标分为固定指标数据采集和动态指标数据采集。 整体指标【采集Node集群中任一节点即可,测试环境可采集其中一台192.168.10.230即可。 在采集对应node节点的指标数据中,如果node节点宕机,则监控指标数据就会失败。 ,其他参数或无参数显示监控KEY #采集范围:任一Node节点,测试可在192.168.10.230,此IP后续建议改为Nginx-Ingress的负载IP,或内部service IP #采集间隔建议5min == "__main__": main() 执行脚本,返回json字符串格式(执行结果显示的是kubernetes所有的对象资源,如pod,deploy,service等的运行状态,根据跑的业务量 zabbix_agent UserParameter 填写的是key值,这个可以随便定义 后面跟上监控脚本的执行过程 [root@bz4ccs001ap1001 ~]# cat /etc/zabbix/

    1.8K40

    关注

    腾讯云开发者公众号
    10元无门槛代金券
    洞察腾讯核心技术
    剖析业界实践案例
    腾讯云开发者公众号二维码

    相关产品

    • 云监控

      云监控

      云监控(CM)可收集并通过图表展示腾讯云云产品自助上报的各项监控指标和用户自定义配置上报的监控指标,以及针对指标设置告警,让您实时、精准掌控业务和各个云产品健康状况。

    相关资讯

    热门标签

    活动推荐

    扫码关注腾讯云开发者

    领取腾讯云代金券