文章
域名劫持防护最佳实践:腾讯云拨测全链路监测与分钟级恢复指南
2025 年 6 月 6 日,国内某头部云服务商因核心域名解析异常引发 5 小时 43 分服务中断,全球范围内 OSS 存储、CDN 节点大面积失效,电商交易停...
文章
可观测迁移实战:从自建困境到高效运维的华丽转身
在教育行业数字化转型进程中,某教育头部客户的运维团队面临自建 SkyWalking 监控系统的严峻挑战。随着业务规模扩张,系统运维复杂度呈指数级增长,运维团队每...
文章
腾讯云可观测平台「预设告警策略」上线!运维新手也能一键搞定告警配置!
在数字化时代,系统故障和异常随时可能引发连锁反应,因此告警的重要性不言而喻。腾讯云监控告警平台作为腾讯云可观测平台的重要组成部分,是承载着云产品监控、APM 监...
文章
产品月报|Prometheus 支持“归档存储”的存储方式,APM 发布新版本接口分析,告警管理预设告警功能上线...
腾讯云可观测平台(Tencent Cloud Observability Platform,TCOP)基于指标、链路、日志、事件的全类型监控数据,结合强大的可视...
文章
Kubernetes 实战:用 Prometheus 提高 K8s 集群弹性伸缩能力的准确性
导语:本文主要通过 Prometheus 在观测 Kubernetes 方面的独特优势,来阐述如何利用 Prometheus 提高 kubernetes 自动弹...
文章
赋能 AI 运维革新:Prometheus 容器化 GPU 监控一站式解决方案
在人工智能(AI)蓬勃发展的当下,图形处理单元(GPU)凭借其强大的并行计算能力,成为了 AI 训练和推理工作负载的核心驱动力。从大规模的深度学习模型训练到实时...
文章
游戏、电商、Web3……「腾讯云可观测」护航企业出海,精准规避跨境网络暗礁
导语:在全球数字化转型和企业出海的浪潮中,「腾讯云可观测」凭借对网络质量和用户体验的高效洞察,深度赋能国内出海企业,助力其有效应对海外公网质量挑战,构建“质量可...
文章
故障定位提速 10 倍!新能源汽车全球化背后的可观测革命
随着全球汽车市场的日益竞争激烈,新能源汽车积极拓展海外市场。在这一过程中,确保系统的稳定性和业务的连续性成为至关重要的任务。本文将探讨如何通过应用性能监控(AP...
文章
腾讯云 APM 应用诊断升级:链路追踪与智能剖析的融合
在某电商平台的监控大屏前,弥漫着紧张的气氛,运维工程师们目不转睛地关注着实时跳动的交易成功率数据,随时准备着系统扩容。
文章
从原理到实践:万字详解 Kubernetes 核心组件与指标监控
Kubernetes 可以说是容器编排领域的事实标准。不管你的业务是运行在公有云、私有云,还是混合云上,Kubernetes 都能给你一种“统一天下”的感觉。它...
文章
DeepSeek 大热背后,不容忽视的 AI 应用体验挑战
在 AI 服务日益成为业务核心的今天,传统监控体系在应对 SSE 这类流式传输协议时暴露出明显短板——当数以万计的异步消息在客户端与服务端间持续流动时,如何捕捉...
文章
客户案例|某车企建设统一监控平台实践
导语:文章主要介绍腾讯云 Prometheus 在监控出行行业的突出优势与解决方案,为客户运维团队降低了很多成本。
文章
Kubernetes 排障实战:用 Prometheus 提升集群可用性和排障效率
导语:本文主要探讨 Prometheus 在观测 Kubernetes 方面的独特优势和最佳实践,包括如何在 Kubernetes 不同层次和维度上实现全面的可...
文章
AI 重塑技术流程:下半场的破局之道
在 10 月 18-19 日举办的 QCon 全球软件开发大会上,腾讯技术总监黄闻欣为我们带来了精彩的专题演讲“AI 重塑技术流程:下半场的破局之道”,演讲揭示...
文章
RUM、APM 强强联手实现全链路监控
导语:文章主要讲解如何让前端性能监控(RUM)和应用性能监控(APM)串联起来,在腾讯云可观测平台实现全链路高效监控。
文章
产品月报|Prometheus 实例监控支持告警数量超限制被限流的统计,APM 全新 Demo 上线...
1.集成云监控新增快速采集【腾讯云数据仓库 TCHouse-C】的监控数据,支持配置采集云产品更多维度的数据。
文章
揭秘可观测利器:腾讯云 APM 深度融合 OpenTelemetry 和 Prometheus,助力高效指标采集与处理
导语:文章主要介绍腾讯云应用性能监控(APM)服务端通过对数据的处理将 OpenTelemetry 指标转换成 Prometheus 指标,输出到腾讯云 Pro...
文章
「可观测」如何为「新能源车企」缓解运维焦虑?
导语:本文将探讨某新能源车企如何借助腾讯云可观测平台,实施可观测性方案,从而缓解运维焦虑,实现更高效的系统管理。
文章
产品月报|Prometheus 支持跨账号采集 ,APM 支持对特定业务系统开启免费模式...
1.支持在容器集群详情页的 Prometheus 监控页面,一键安装集成中心中更多类型的组件监控,缩短用户使用路径。
文章
产品月报|Prometheus 支持新建容器集群时自动开通 Prometheus 监控,APM 支持用户自定义应用健康阈值...
2.Prometheus 国际站采集端架构升级,支持实例诊断、系统健康检查,并提升了采集 Agent 资源利用率和指标采集稳定性。