首页
学习
活动
专区
圈层
工具
发布

#优化

2025,AI Agent 告别 “概念炒作”,进入规模化实战期

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

如果说前两年的企业级 AI Agent 还停留在 “实验室试水”,2025 年无疑是其落地的 “关键拐点”。企业态度彻底转变:不再纠结 “技术多先进”,而是紧盯...

7310

vivo X300 Pro 太狠:Ultra 同款设计 + 双 CIPA 5.5 防抖,这哪是 Pro?是杀器!

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

在旗舰手机市场,"Pro"与"Ultra"的分级曾是不成文的规矩——前者稳居中高端,后者才是堆料拉满的终极形态。但vivo X300 Pro的到来,彻底搅乱了这...

12400

IDEA 2026.2 EAP 7 正式发布:这 12 个新功能,升级后立刻爽

DevLlama

Thymeleaf 模板里写个 th:inline="javascript",IDE 硬生生标红报错;项目一打开,application.yaml 满屏红色波浪...

10200

如何用 SkillHub + QClaw 打造内容运营自动化流水线?

克劳德2048

摘要 SkillHub 提供丰富的 AI Skills 资源,QClaw 作为 AI 智能体框架支持对接多生态工具。本文介绍如何结合两者,搭建面向内容运营场景的...

10610

一线开发者,三层拆解国产IB通信体验

PikeTalk

在分布式训练中,网络往往是最难诊断的瓶颈。同样的硬件集群,不同团队跑出的训练效率可能相差数倍,而差距通常不在代码逻辑,而在网络参数的“手感”——AllReduc...

8610

RAG模式到底有8种?还是9种?还是25种?

jeffery_jcm

首先一句话通俗解释什么是RAG? 全称: Retrieval-Augmented Generation (检索增强生成) :RAG是一种结合信息检索与大语言模型...

8300

如何编写自己的 AI Skill?从零开始创建 SKILL.md

克劳德2048

摘要 编写自己的 AI Skill 可以让 AI 助手学习个人特有的工作流程。本文介绍从零开始创建 SKILL.md 文件的完整流程,包括确定使用场景、编写指令...

16410

2024 KL的年终总结

kl博主

时间过得飞快,转眼便迎来了 2025 年。回想上一次写年终总结还是在 2023 年,那时正沉浸在疫情彻底告别后的自由感中,而今年则展现了另一番风景。回顾 2...

7510

ClickHouse CPU 100%的问题排查与优化

kl博主

最近我们收到用户反馈,Sentry Web 无法正常刷数据,过一会儿又好了。经过初步排查,发现问题根源在于 ClickHouse 的 CPU 使用率居高不下,甚...

9210

OpenTelemetry Collector 节点宕机场景下的排查与优化

kl博主

触发本次问题的 OpenTelemetry Collector 版本为 0.73.0(发布于 2023 年初)。此版本的负载均衡器实现存在已知问题,尤其是在处理...

5410

GEO不是捷径,是内容价值的回归——专访GEO高级优化师罗长才

罗长才

当AI成为用户获取信息的第一界面,内容创作者该如何应对这场范式转移?GEO高级优化师罗长才给出的答案,可能比你想象的更加回归本质。

8810

从对齐偏好到提升推理:RADIO框架如何重塑检索增强生成

用户9565775

这种由预训练数据与优化目标差异导致的组件间偏好错位,使得重排序器精心挑选的“最佳”文档,在生成器眼中可能并非最优选择,最终导致系统给出的答案准确性下降。

8110

Java锁机制深度解析:从重量级到智能升级

用户9565775

Java锁优化技术代表了软件工程中一个经典问题的持续演进:在保证正确性的前提下最大化并发性能。从重量级锁到偏向锁、轻量级锁,再到锁粗化和锁消除,每一步优化都是对...

12010

蚂蚁 Ling / Ring 2.6 技术报告

唐国梁Tommy

当所有人都在比谁的模型更大、谁烧的算力更多时,蚂蚁 Inclusion AI 的这份技术报告反其道而行:它没有从零再训一个万亿参数模型,而是把一个已经训好的万亿...

8610

在黑暗中进化的 Agent:没有标准答案,它怎么把自己越练越强?

唐国梁Tommy

这篇论文叫 Evolving Agents in the Dark,方法名为 RHO(Retrospective Harness Optimization,回顾...

9610

持续学习:AI 从短期记忆到会睡眠的模型

唐国梁Tommy

注意力是在 token 之间做关联;反向传播则像在梯度和参数之间做一种上下文学习;优化器里的 momentum,也是在压缩一段梯度历史。模型结构处理 token...

11410

MetaClaw 如何让 Agent 在真实业务中持续进化?

唐国梁Tommy

目前绝大多数部署在生产环境中的 LLM Agent 都面临一个根本性矛盾:模型权重和系统 Prompt 在上线那一刻就被冻结了,但用户的实际需求分布却在不断漂移...

12310

清华&智谱 — IndexCache:跨层复用Top-k索引加速稀疏注意力

唐国梁Tommy

这是一个极其优雅的数学设计,它与直接优化多个单层 KL 散度之和的梯度完全等价。这意味着索引器被迫学到了一个跨层的"共识"集合。一旦加入这种联合优化,免训练方案...

9510

从万亿基座到智能涌现——KIMI K2 & K2 Thinking 深度解析

唐国梁Tommy

Kimi K2 延续并优化了 MoE 架构,其核心思想是通过激活一小部分“专家”网络来处理信息,从而在巨大模型规模下保持高效推理。

16810

微软发布 Agent Lightning,让强化学习无缝融入任何Agent

唐国梁Tommy

2️⃣ 利用现有单次RL算法优化:一旦每个动作都有了对应的奖励,就可以直接套用成熟的单次RL算法(比如PPO、GRPO、REINFORCE++等)来优化LLM。

12500
领券