前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >我的 Grafana 能对接你的 Prometheus 监控服务吗?

我的 Grafana 能对接你的 Prometheus 监控服务吗?

作者头像
腾讯云可观测平台
发布2021-06-18 10:10:09
1.2K0
发布2021-06-18 10:10:09
举报
文章被收录于专栏:腾讯云可观测专栏

简介

前言感谢各位用户在云监控用户交流群中的积极发言,踊跃提问,感谢大家的支持,在此把 Grafana 插件和 Prometheus 监控服务相关的一些问题整理如下。

Grafana 插件

腾讯云于 4 月 20 日宣布与开源数据可视化平台 Grafana 的 Grafana Labs 合作,为全球云用户提供腾讯云 Grafana 云监控应用程序插件。用户可通过此插件,在简单易用的平台上快速监控与整合指标和数据。目前已经支持 30+ 款腾讯云基础产品的接入展示。点击此处了解 Grafana 插件

Q:secretid secretkey 需要关联什么策略才能使用 Grafana 云监控应用程序插件?同时,也希望配置具体的监控权限

A:和云监控 API 拉取所需要的策略相同,云监控只读访问权限 QcloudMonitorReadOnlyAccess 或全读写权限 QcloudMonitorFullAccess,同时赋权对应的云产品策略,具体可参考 https://cloud.tencent.com/document/product/248/45428

Q: 用 Grafana 插件的用户看全部云产品需要配置什么权限?

A: 只需要给子账户设置全局只读权限即可,如下图所示(https://console.cloud.tencent.com/cam/policy/detail/400411&ReadOnlyAccess&2):

Q:变量如何支持多选呢?除了建多个 panel/query 之外有别的推荐的方式吗?希望能在一个 Dashboard 一次看到所有的实例状态。

A:可以通过模板变量的方式配置

在配置模板变量的时候勾选 multiple value,下拉框就是多选的,因为默认的模板是单实例的,多实例可以在单实例模板上新建自定义模板。

Q:区域支持多选吗? A:暂时不支持多选

Q:我在腾讯云 Grafana 应用插件提供的模板中,添加了 Variables:InstanceName,但是切换展示源的时候图表信息不会随之改变?

A: 可以在 publicIp 模板变量后面添加 &display=InstanceName−{InstanceId} 拼接你想展示的 InstanceName 和 ID,就不用单独创建一个 InstanceName 的模板变量了,因为自己创建的变量没有在 Dashboard 中绑定使用 https://github.com/TencentCloud/tencentcloud-monitor-grafana-app/#%E6%A8%A1%E6%9D%BF%E5%8F%98%E9%87%8F

Prometheus 监控服务

Prometheus 是一个开源监控系统。现最常见的 Kubernetes 容器管理系统中,通常会搭配 Prometheus 进行监控。腾讯云 Prometheus 监控服务(Managed Service for Prometheus TMP)在继承开源 Prometheus 监控能力的同时 ,还提供高可用的 Prometheus 服务、开源可视化的 Grafana 和云监控告警,可以减少用户的开发及运维成本。

Q:能介绍一下和自建有啥区别吗,感觉社区都有? A:自建有运维和研究改造社区版本的成本,使用云服务能节省这些运维成本。同时,腾讯云 Prometheus 监控服务也会集成常见服务的大盘和报警,节省开发成本。

Q:怎么配置自定义监控? A:可以在控制台中点击集成容器服务 ->TKE 集群 ID-> 服务发现中创建 PodMonitor/ServiceMonitor。 目前可以通过 Prometheus 监控服务完成自定义指标上报,具体的指引可以参考:https://cloud.tencent.com/document/product/1416/56027

Q:是否可以定期查询某个集合,当该集合的某个字段超过阈值就报警?

A:这种业务性质的,估计业务方根据自己的特点来自己实现了,用 Prometheus client 写一个就好了。

Q: 将 Prometheus svc 创建到 VPC 网络中,通过内网页面访问,发现页面上没有查询的功能模块(背景是项目会自己创建 service monitor,通过服务发现,收集自定义指标到 prometheus 中,再查询页面进行数据验证、调试)?

A:产品已经都已经集成了以上功能,数据源默认已经加上,用户还需要自行加上 service monitor,然后在 Grafana Explore 验证数据是否过来。

Q:我们自定义的的数据通过自动发现存储到你们的 Prometheus 中,现在我们自己的监控系统需要引用这个数据源,是否可以支持?

A:可以支持

Q: K8s 的存活检查,能检测到么? A: 可以用 blackbox -exporter,新版本的 Prometheus Operator 已经可以直接集成了。详情可参考:https://cloud.tencent.com/edu/learning/live-3288

Q: 我自建的 Grafana 能不能对接你们的 Prometheus? A: 支持,只要自建的 Grafana 和腾讯云 Prometheus 监控服务在一个 VPC 内自建就可以对接。

Q:Prometheus 监控服务是否可以 remote write 到我们自建的时序数据库里? A:支持,如果原来自建了 Prometheus,改一下 remote write 配置数据就可以到托管服务上,remote write、pushgateway 的地址在实例详情里可以找到。

其它

Q: 如果子机的 agent 因为机器的性能瓶颈了,导致监控丢失会触发告警吗? A:可以通过配置 ping 不可达实现。

Q:ping 不可达是自动开启的吗? A: 需要在告警配置中设置对 ping 不可达 这个事件进行订阅。

感谢:@Kasun,@sophie mar @奈 @虻梦 @soul @姿态 等等~同学的咨询和反馈~让我们离用户更近:)

欢迎联系云监控小助手微信号,加群讨论:)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云可观测 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
前端性能监控
前端性能监控(Real User Monitoring,RUM)是一站式前端监控解决方案,专注于 Web、小程序等场景监控。前端性能监控聚焦用户页面性能(页面测速,接口测速,CDN 测速等)和质量(JS 错误,Ajax 错误等),并且联动腾讯云应用性能监控实现前后端一体化监控。用户只需要安装 SDK 到自己的项目中,通过简单配置化,即可实现对用户页面质量的全方位守护,真正做到低成本使用和无侵入监控。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档