机器之心

文章/答案/技术大牛

发布

LV0

全部文章

教机器人捏橡皮泥？MIT、IBM, UCSD等联合发布软体操作数据集PlasticineLab
机器之心专栏作者：MIT CSAIL 「PlasticineLab」的提出，或为软体动力学领域的众多研究提供了新思路。虚拟环境（ALE、MuJoCo、Op...
机器之心 5天前2026-01-04 10:03:14
强化学习、机器人、数据、算法、优化
速度堪比Adam，准确率媲美SGD，还能稳定训练GAN：全新优化器成为NeurIPS爆款
机器之心报道作者：张倩、小舟在一篇 NeurIPS 2020 Spotlight 论文中，来自耶鲁大学等机构的研究者提出了一种新型优化器，可以像 Adam ...
机器之心 5天前2026-01-04 10:02:41
声纹识别、gan、论文、性能、优化
有监督解耦与信息压缩相结合，上交新型信息瓶颈算法实现良好的泛化、鲁棒性能
机器之心发布作者：潘子琦单位：上交BCMI实验室现有的有监督解耦方法，比如把中间表征解耦成种类相关的表征和种类无关的表征，大多基于交换生成的经验性框架，缺...
机器之心 5天前2026-01-04 10:01:47
数据、算法、性能、压缩、优化
深度拆解沐曦MXMACA软件栈功能，算力自主+生态兼容，破解国产GPU落地难题
近日，刚刚 IPO 的国产 GPU 公司沐曦股份，完成了自上市后的首个重大技术发布。
机器之心 9天前2025-12-31 13:05:17
gpu、框架、模型、软件、优化
QwenLong-L1.5发布：一套配方，三大法宝，让30B MoE模型长文本推理能力媲美GPT-5
作为大模型从业者或研究员的你，是否也曾为一个模型的 “长文本能力” 而兴奋，却在实际应用中发现它并没有想象中那么智能？
机器之心 9天前2025-12-31 13:05:09
性能、gpt、框架、模型、数据
AAAI 2026 Oral｜LENS：基于统一强化推理的分割大模型
文本提示图像分割（Text-prompted image segmentation）是实现精细化视觉理解的关键技术，在人机交互、具身智能及机器人等前沿领域具有重...
机器之心 9天前2025-12-31 13:05:00
框架、模型、设计、优化、强化学习
一封AI邮件，竟让Go语言之父爆起粗口
现年 69 岁的传奇程序员、「Go 语言之父」Rob Pike，这几天被一封邮件惹毛了，接连几个「F**k」爆起粗口。
机器之心 9天前2025-12-31 13:04:52
程序员、数据、系统、go、编程
马斯克的「移动客厅」又火了：20人座无方向盘，每公里才3毛钱
前段时间，旧金山大停电，Waymo 无人驾驶出租车集体趴窝，但依靠 FSD 系统驱动的特斯拉汽车丝毫不受影响。
机器之心 9天前2025-12-31 13:04:43
视频、系统、自动驾驶、设计、摄像头
AI 真能看懂物理世界吗？FysicsWorld：填补全模态交互与物理感知评测的空白
因此，一个面向真实物理世界的先进的全模态智能架构，不仅需要对真实世界中的多模态交互做出正确响应，还应具备遵循物理世界规律的感知与推理能力，以实现对复杂现实环境的...
机器之心 9天前2025-12-31 13:04:33
模型、数据、音频、语音、基础
SIGGRAPH Asia 2025｜当视频生成真正「看清一个人」：多视角身份一致、真实光照与可控镜头的统一框架
第一作者徐源诚是 Netflix Eyeline 的研究科学家，专注于基础 AI 模型的研究与开发，涵盖多模态理解、推理、交互与生成，重点方向包括可控视频生成及...
机器之心 9天前2025-12-31 13:02:18
数据、基础、框架、模型、视频
AI大佬Karpathy焦虑了：作为程序员，我从未感到如此落后
年末的假期，正是总结思考的时候。不过对于程序员来说，仔细这么一想可能会感觉有点不对劲。
机器之心 9天前2025-12-31 13:02:06
模型、编程语言、编码、程序员、工具
告别「单线程」思维：通研院提出NPR框架，让智能体进化出原生的并行推理大脑
近年来，大语言模型在「写得长、写得顺」这件事上进步飞快。但当任务升级到真正复杂的推理场景 —— 需要兵分多路探索、需要自我反思与相互印证、需要在多条线索之间做汇...
机器之心 9天前2025-12-31 13:01:59
框架、模型、数据、强化学习、测试
视频生成DeepSeek时刻！清华&生数开源框架提速200倍，一周斩获2k Star
在 2025 年的最后时刻，一个全新视频生成加速框架的开源宣告了：「等待数分钟才能生成一个视频」的时代已经终结！
机器之心 9天前2025-12-31 13:01:50
视频、DeepSeek、开源框架、量化、模型
Agent「记吃不记打」？华为诺亚&港中文发布SCOPE：Prompt自我进化，让HLE成功率翻倍
在 LLM Agent 领域，有一个常见的问题：Agent 明明 "看到了" 错误信息，却总是重蹈覆辙。
机器之心 9天前2025-12-31 13:00:36
华为、优化、agent、prompt、scope
顶刊TPAMI｜多模态视频理解领域重磅数据更新：MeViSv2发布
近日，多模态视频理解领域迎来重磅更新！由复旦大学、上海财经大学、南洋理工大学联合打造的 MeViSv2 数据集正式发布，并已被顶刊 IEEE TPAMI 录用。
机器之心 9天前2025-12-31 13:00:30
数据、音频、视频理解、模型、视频
腾讯按下AI加速键，人才、组织、开源动作密集
但在 2025 年的尾声，从人才引进到产品迭代再到组织变革，一系列密集信号的发出，也侧面表明这个巨头正在按下加速键。
机器之心 9天前2025-12-31 13:00:20
工具、架构、模型、腾讯、开源
无需再训练微调，一个辅助系统让GPT-5.2准确率飙到创纪录的75%
什么？决定 AI 上限的已不再是底座模型，而是外围的「推理编排」（Orchestration）。
机器之心 9天前2025-12-31 13:00:11
数据、系统、gpt、测试、模型
越狱成功率飙升至87.6%，南京大学联合美团、上交破解主流视频生成模型安全漏洞
来自南京大学 PRLab 的王淞平、钱儒凡，在单彩峰教授与吕月明助理教授的联合指导下，提出首个面向图生视频（I2V）模型的多模态自进化越狱攻击框架 Runawa...
机器之心 9天前2025-12-31 12:50:29
模型、视频、安全、安全漏洞、框架
技术革新+生态赋能：多彩新媒构建智慧广电新标杆
很多人可能并不了解，在贵州，IPTV 已经成为当下覆盖最广的家庭信息入口之一 —— 家庭覆盖率接近 89%，用户规模超过 1129.5 万户。
机器之心 9天前2025-12-31 12:50:16
数据、终端、安全、行业、架构
VideoCoF：将「时序推理」引入视频编辑，无Mask实现高精度编辑与长视频外推！
本文第一作者是 UTS 博士生杨向鹏，主要研究方向是视频生成和世界模型；第二作者是谢集，浙江大学的四年级本科生，主要研究方向统一多模态大模型和视频生成。通讯作者...
机器之心 9天前2025-12-31 12:50:02
mask、模型、设计、视频、数据

12 3 4 5 6 7 8...507 下一页

个人简介

全球人工智能信息服务
专业的人工智能媒体和产业服务平台
人工智能深度学习机器学习神经网络 github
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2018-04-27

个人成就

获得 30.9K 次赞同
文章被阅读 9M 次
文章获得 4 次首页推荐

关注了：1关注者：740

机器之心

全部文章

教机器人捏橡皮泥？MIT、IBM, UCSD等联合发布软体操作数据集PlasticineLab

速度堪比Adam，准确率媲美SGD，还能稳定训练GAN：全新优化器成为NeurIPS爆款

有监督解耦与信息压缩相结合，上交新型信息瓶颈算法实现良好的泛化、鲁棒性能

深度拆解沐曦MXMACA软件栈功能，算力自主+生态兼容，破解国产GPU落地难题

QwenLong-L1.5发布：一套配方，三大法宝，让30B MoE模型长文本推理能力媲美GPT-5

AAAI 2026 Oral｜LENS：基于统一强化推理的分割大模型

一封AI邮件，竟让Go语言之父爆起粗口

马斯克的「移动客厅」又火了：20人座无方向盘，每公里才3毛钱

AI 真能看懂物理世界吗？FysicsWorld：填补全模态交互与物理感知评测的空白

SIGGRAPH Asia 2025｜当视频生成真正「看清一个人」：多视角身份一致、真实光照与可控镜头的统一框架

AI大佬Karpathy焦虑了：作为程序员，我从未感到如此落后

告别「单线程」思维：通研院提出NPR框架，让智能体进化出原生的并行推理大脑

视频生成DeepSeek时刻！清华&生数开源框架提速200倍，一周斩获2k Star

Agent「记吃不记打」？华为诺亚&港中文发布SCOPE：Prompt自我进化，让HLE成功率翻倍

顶刊TPAMI｜多模态视频理解领域重磅数据更新：MeViSv2发布

腾讯按下AI加速键，人才、组织、开源动作密集

无需再训练微调，一个辅助系统让GPT-5.2准确率飙到创纪录的75%

越狱成功率飙升至87.6%，南京大学联合美团、上交破解主流视频生成模型安全漏洞

技术革新+生态赋能：多彩新媒构建智慧广电新标杆

VideoCoF：将「时序推理」引入视频编辑，无Mask实现高精度编辑与长视频外推！

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

机器之心

教机器人捏橡皮泥？MIT、IBM, UCSD等联合发布软体操作数据集PlasticineLab

速度堪比Adam，准确率媲美SGD，还能稳定训练GAN：全新优化器成为NeurIPS爆款

有监督解耦与信息压缩相结合，上交新型信息瓶颈算法实现良好的泛化、鲁棒性能

深度拆解沐曦MXMACA软件栈功能，算力自主+生态兼容，破解国产GPU落地难题

QwenLong-L1.5发布：一套配方，三大法宝，让30B MoE模型长文本推理能力媲美GPT-5

AAAI 2026 Oral｜LENS：基于统一强化推理的分割大模型

一封AI邮件，竟让Go语言之父爆起粗口

马斯克的「移动客厅」又火了：20人座无方向盘，每公里才3毛钱

AI 真能看懂物理世界吗？FysicsWorld：填补全模态交互与物理感知评测的空白

SIGGRAPH Asia 2025｜当视频生成真正「看清一个人」：多视角身份一致、真实光照与可控镜头的统一框架

AI大佬Karpathy焦虑了：作为程序员，我从未感到如此落后

告别「单线程」思维：通研院提出NPR框架，让智能体进化出原生的并行推理大脑

视频生成DeepSeek时刻！清华&生数开源框架提速200倍，一周斩获2k Star

Agent「记吃不记打」？华为诺亚&港中文发布SCOPE：Prompt自我进化，让HLE成功率翻倍

顶刊TPAMI｜多模态视频理解领域重磅数据更新：MeViSv2发布

腾讯按下AI加速键，人才、组织、开源动作密集

无需再训练微调，一个辅助系统让GPT-5.2准确率飙到创纪录的75%

越狱成功率飙升至87.6%，南京大学联合美团、上交破解主流视频生成模型安全漏洞

技术革新+生态赋能：多彩新媒构建智慧广电新标杆​

VideoCoF：将「时序推理」引入视频编辑，无Mask实现高精度编辑与长视频外推！

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

技术革新+生态赋能：多彩新媒构建智慧广电新标杆