前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >08 Feb 2023 可观察性平台检查表

08 Feb 2023 可观察性平台检查表

作者头像
俊采
发布2023-10-17 10:21:41
1280
发布2023-10-17 10:21:41
举报
文章被收录于专栏:LEo的网络日志

最近因为工作需要,调研和使用几个可观察性工具和平台,分别如下:

  • prometheus + grafana
  • splunk
  • azure managed grafana
  • dynatrace
  • datadog

在使用过程中,这些平台各有利弊,于是想着写一个checklist,权当总结学习。

  • 能提供免费的试用账户,方便用户快速搭建poc
  • 提供内置的alert,能快速和现有的服务和应用集成,比如提供一些常见数据库的alert,当收集到metrics后,可以一键启用这些内置的alert,快速搭建一个可用的监控系统
  • 提供一些推荐的alert,方便用户参考定义alert
  • 提供内置的dashboard,能及时展示收集到的数据如metrics、log和events
  • 支持config as code,方便维护配置、alert和dashboard等
  • 提供丰富的api和文档支持,最好在页面端自动生成调用api所需的数据,方便用户做自动化集成
  • 一键部署agent,能快速和先用的服务和应用集成,快速收集监控数据如metrics、log和events
  • 支持数据存储或者可以存储数据到第三方如s3
  • 能提供相应的分析报告
  • 支持屏蔽日志中的敏感数据,如配置相应的rule去替换铭感数据
  • 支持常见的公有云平台如azure、aws和gcp,能一键集成并收集到相应的监控数据
  • 支持集成常见的通知系统如slack、pagerduty和email
  • 提供webhook方便收到alert或event后做二次开发,如收到alert后自动创建issue
  • 支持常见的metric endpoint,如prometheus和opentelemetry collector
  • 根据用户的配置和使用给出相应的建议,例如推荐启用相应功能、安装某些扩展
  • 对于saas类可观察性平台,用户能方便快速知道所有开支
  • 提供扩展功能,方便用户二次开发满足特殊监控需求
  • 提供url检查服务,类似ping的功能一样,能快速检查api或者端口等状态
  • 支持配置指标、日志和事件等黑名单过滤数据

:) 未完待续……

LEo at 00:12

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
Grafana 服务
Grafana 服务(TencentCloud Managed Service for Grafana,TCMG)是腾讯云基于社区广受欢迎的开源可视化项目 Grafana ,并与 Grafana Lab 合作开发的托管服务。TCMG 为您提供安全、免运维 Grafana 的能力,内建腾讯云多种数据源插件,如 Prometheus 监控服务、容器服务、日志服务 、Graphite 和 InfluxDB 等,最终实现数据的统一可视化。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档