全球人工智能信息服务

机器之心

代码在线跑，知识轻松学

Python精品学习库

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

博客搬家 | 分享价值百万资源包

往期视频·干货材料·成员作品 最新动态

技术创作特训营·精选知识专栏

新邀入驻腾讯云开发者社区，福利多多！

如何运用「云、端融合的数智化安全体系」高效护航数据安全

左手AI，右手安全 —— 一汽丰田数字化转型之路

一项最新调查显示，全球至少 14 所顶尖大学的研究论文中被植入了仅有 AI 能够读取的秘密指令，诱导 AI 审稿提高评分。

真有论文这么干？多所全球顶尖大学论文，竟暗藏AI好评指令

本文第一作者是上海交通大学计算机学院三年级博士生程彭洲，研究方向为多模态大模型推理、AI Agent、Agent 安全等。通讯作者为张倬胜助理教授和刘功申教授。

让GUI智能体不再「过度执行」，上海交大、Meta联合发布OS-Kairos系统

前段时间，中文大模型测评基准 SuperCLUE 发布了 2025 年 5 月报告。这份报告评估了来自 OpenAI、谷歌、DeepSeek、字节跳动等多家国内外 AI 公司的大模型，并发布了多个榜单。报告显示，虽然海外模型在综合能力上占优，但国内模型在推理任务中表现亮眼，Doubao-1.5-thinking-pro-250415 与星云大模型 NebulaCoder-V6 以推理总分 67.4 并列第一。

SuperCLUE推理榜惊现黑马：原来中兴是一家AI公司？

此刻我们正处在什么样的时代？是姚顺雨笔下的「AI 的下半场」，是 Andrej Karpathy 定义的「软件 3.0 时代」，也是一个创造者与 AI 协同进化，重新定义「可能」的时代。

你的下一个AI项目灵感，藏在首届魔搭开发者大会的七大论坛里

本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。通讯作者为刘东瑞和邵婧，上海 AI Lab 安全团队，研究方向为 AI 安全可信。

你的Agent电脑助手正在踩雷！最新研究揭秘Computer-Use Agent的安全漏洞

在 AI 时代的浪潮下，顶尖人才影响力空前高涨，其地位更被市场推升至了前所未有的高度。无论是谷歌 Transformer 论文八子，还是从 OpenAI 出走的科学家，他们要么自立门户，拿到亿级投资、百亿级估值，或者跳槽到他处，凭己之力拉近企业间的技术代差甚至影响竞争格局。

95后，边改造业务边发AI顶会论文，是怎样的体验？

在对复杂任务的推理工作上，当前的大语言模型（LLM）主要采用思维链（CoT）技术，但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。

只用2700万参数，这个推理模型超越了DeepSeek和Claude

在日常生活中，我们常通过语言描述寻找特定物体：“穿蓝衬衫的人”“桌子左边的杯子”。如何让 AI 精准理解这类指令并定位目标，一直是计算机视觉的核心挑战。现有方法常被两大问题困扰： 决策过程不透明 （“黑箱” 预测）和 拒识能力不足 （对不存在物体输出错误结果）。

会“思考”的目标检测模型来了！IDEA提出Rex-Thinker：基于思维链的指代物体检测模型，准确率+可解释性双突破

今天，著名的人工智能学者和认知科学家 Gary Marcus 转推了 MIT、芝加哥大学、哈佛大学合著的一篇爆炸性论文，称「对于 LLM 及其所谓能理解和推理的神话来说，情况变得更糟了 —— 而且是糟糕得多。」

Gary Marcus惊世之言：纯LLM上构建AGI彻底没了希望！MIT、芝大、哈佛论文火了

这两天 Andrej Karpathy 的最新演讲在 AI 社区引发了热烈讨论，他提出了「软件 3.0」的概念，自然语言正在成为新的编程接口，而 AI 模型负责执行具体任务。

盘一盘，2017年Transformer之后，LLM领域的重要论文

李浩然，CMU 机器学习系研究生，研究方向是基础模型的长上下文建模、对齐、以及检索增强生成。

打破长视频理解瓶颈：HoPE混合位置编码提升VLM长度泛化能力

不知大家是否还记得 Roy Lee 这位网红小哥，他曾先后被哈佛大学和哥伦比亚大学开除，之后辍学创办公司，并成功获得 530 万美元的投资。如今，他的初创公司 Cluely 已经成为业界热议的话题，尤其是在 AI 技术应用领域。 

扬言将杀死9个行业，21岁小哥又开发人生作弊器，曾被哥大、哈佛开除

据路透社等多家媒体报道，一位知情人士称，OpenAI 最近开始租用谷歌的 AI 芯片来支持 ChatGPT 及其其他产品。

OpenAI转向谷歌TPU：宿敌也能变朋友？

本文第一作者为美国东北大学博士生沈轩，研究方向为高效人工智能，致力于在 GPU、移动端、FPGA 和 ASIC 等多种硬件平台上实现大模型的高效部署与加速。第二作者为香港中文大学的韩晨夏，研究方向聚焦于计算机体系结构与 AI 系统的高效化设计。

无需训练，即插即用，2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

它主打一个「全能」：不论输入的是文本还是静音的视频，它都会给你生成配套的音效或音乐，节奏踩点准确，细节到位合理。更有趣的是，它还能配合视频场景里面的环境，呈现出立体声。

音画同步，AI视频也能有完美「原声音」，可灵AI刚上线的！

「我们非常高兴地推出 Mercury，这是首款专为聊天应用量身定制的商业级扩散 LLM！Mercury 速度超快，效率超高，能够为对话带来实时响应，就像 Mercury Coder 为代码带来的体验一样。」

这个扩散LLM太快了！没有「请稍后」，实测倍速于Gemini 2.5 Flash

本文第一作者为北京邮电大学副教授、彩云科技首席科学家肖达，其他作者为彩云科技算法研究员孟庆业、李省平，彩云科技CEO袁行远。

ICML 2025 | 打破残差连接瓶颈，彩云科技&amp;北邮提出MUDDFormer架构让Transformer再进化！

ICCV 2025 将于 10 月 19 日至 25 日在美国夏威夷举行。刚刚，ICCV 官方向投稿者发送了今年论文接收结果的通知。

ICCV 2025放榜！录取率24%，夏威夷门票你抢到了吗？

本文由中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队共同完成。第一作者郑晨宇是中国人民大学高瓴人工智能学院二年级博士生，主要研究方向为基础模型的优化、泛化和可扩展性理论，导师为李崇轩副教授，论文为其在字节跳动Seed实习期间完成。第二作者张新雨是字节跳动研究员，主要研究方向为视觉生成模型。李崇轩副教授为唯一通讯作者。

人民大学&amp;字节Seed：利用μP实现Diffusion Transformers高效扩展

过去几年，随着基于人类偏好的强化学习（Reinforcement Learning from Human Feedback，RLHF）的兴起，强化学习（Reinforcement Learning，RL）已成为大语言模型（Large Language Model，LLM）后训练阶段的关键技术。RL 不仅显著提升了模型的对齐能力，也拓展了其在推理增强、智能体交互等场景下的应用边界。围绕这一核心范式，研究社区不断演化出多种优化策略和算法变体，如 Agentic RL、RLAIF、GRPO、REINFORCE++ 等。这些新兴范式虽然形式各异，但底层需求高度一致：几乎都涉及多模块协同（Actor、Critic、Reward、Ref）与多阶段流程（生成、推理、训练）的高效调度。这也对训练框架提出了更高的要求：不仅要支持大规模模型的高效训练，还需具备良好的可扩展性与开发友好性。因此，一套真正高效、可扩展且用户友好的 RL 系统框架，成为业界刚需。

重磅！淘天联合爱橙开源强化学习训练框架ROLL，高效支持十亿到千亿参数大模型训练

文章

问答

视频

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋 

腾讯云代码助手

CODING DevOps

Cloud Studio

SDK中心

API中心

命令行工具

腾讯云开发者社区推出了机器之心专栏，为你提供了机器之心的相关文章，致力于帮助开发者快速成长与发展。

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐