首页
学习
活动
专区
圈层
工具
发布

#监控

半夜2点的告急:一次生产故障的抢救现场

悠悠12138

凌晨2点,电话响了。Slack 上的 critical alert 红成一片,数据库查询延迟突然飙到 30 秒,用户开始投诉页面卡死。我迷蒙着眼睛爬起来,这是我...

1000

AP射频健康度<60 优化完整实操方案(可直接交付运维/现场实施)

ICT系统集成阿祥

射频健康度低于60代表当前射频干扰大、信道冲突、功率不合理、冗余射频抢占频谱、覆盖参数不匹配,会引发终端掉线、速率低、漫游卡顿、高误码,需从信道、功率、冗余射频...

1000

ANR 治理 2026:从一次低端机翻车到主线程立体监控

陆业聪

上周线上出了个 ANR,问题挺典型,但排查过程让我重新审视了 ANR 这个老问题。

400

绿灯不是真相

随机比特

腾讯 | 高级前端工程师 (已认证)

你让 AI 改完那个折腾你三天的 bug,它很快回了你一段话:「已修复,我把空指针那里加了判空,并补充了边界处理。」你扫了一眼 diff,逻辑看着对;你跑了一下...

1100

【Blog】使用Zabbix监控Starlink Dish

Zabbix

现在你可以点击监控项页面中新建的监控项左侧的三个点,为感兴趣的每个值创建依赖监控项了!

900

图片结构化信息提取:从非结构化图像到结构化数据

hollyx

在安防监控场景中,监控画面需要被理解为结构化的事件信息,以便进行事件检索和统计分析。

2400

RAG 跑通之后,我才发现真正缺的是一个"运维平台"

王中阳AI编程

去年开始,RAG(检索增强生成)成了 AI 应用的标配。搜 GitHub,"RAG" 相关仓库几万个,LangChain、LlamaIndex、Haystack...

4510

日处理700万条告警的智能管家, OCManager 正式开源

腾讯云开发者

OCManager 监控模块专为系统级排障设计,解决传统监控“只能看整机虚高、无法定位具体硬件瓶颈”的被动局面。单机指标采集深度覆盖CPU、内存、磁盘 I/O、...

5000

日处理700万条告警的智能管家, OCManager 正式开源

腾源会

腾讯云 | 开源运营经理 (已认证)

OCManager 监控模块专为系统级排障设计,解决传统监控“只能看整机虚高、无法定位具体硬件瓶颈”的被动局面。单机指标采集深度覆盖CPU、内存、磁盘 I/O、...

4510

搞AI接口代理这一年,我踩过的坑比代码还多

用户12493922

5810

大模型幻觉检测新方法:实时高亮不确定内容

用户11563501

当AI医生给你一份“凭空捏造”的诊疗方案,或者AI律师引用一条“子虚乌有”的法律条文时,大模型的“幻觉”将会给现实世界带来巨大的风险。

7310

59% 学生用 AI 查资料:堵不如疏,AI 教育的正确打开方式

用户12105527

很多学校的选择是"一刀切":禁止使用 AI 工具、作业必须手写、考试全程监控。听起来很严格,但效果呢?

9310

线上 CPU 飙升,如何排查分析处理?

千羽

目标:确认是哪个进程导致 CPU 使用率过高。 工具:top、htop、ps。 操作:

6910

SRE 监控和告警浅谈

Wangzy

记得最开始接触运维工作的时候,当初接触的第一款监控告警工具是zabbix,集监控和告警于一身,通过在监控对象上部署客户端,采集固定的监控指标或自定义脚本的指标。

9510
领券