谷歌DeepMind新AI：机器人无需训练，也能执行现实复杂任务？

文章来源：企鹅号 - ITBear科技资讯

谷歌DeepMind在人工智能领域再次迈出重要一步，近日推出了两款专为现实世界任务设计的AI模型，旨在增强机器人的功能与适应性。

其中一款名为Gemini Robotics的模型，凭借其强大的视觉语言行动能力，让机器人无需特定训练即可理解并应对全新的情境。这款模型基于DeepMind的最新旗舰AI——Gemini 2.0构建。据DeepMind机器人部门的高级总监Carolina Parada介绍，Gemini Robotics通过整合Gemini的多模态世界理解能力，并加入物理行动的新模态，成功实现了向现实世界的拓展。

Gemini Robotics在构建高效机器人所需的三大核心领域——通用性、互动性和灵活性上取得了显著进展。它不仅能够灵活应对各种新情境，还在与人类及环境的互动中展现出更出色的表现，甚至能够执行如折纸、打开瓶盖等精细的物理操作。

另一款新模型名为Gemini Robotics-ER（具象推理），DeepMind将其描述为一种能够“理解复杂且动态世界”的先进视觉语言模型。Parada进一步解释，当执行如装便当盒等任务时，机器人需要考虑桌上物品的位置及操作步骤，而Gemini Robotics-ER正是为解决此类推理任务而设计的。通过该模型，机器人专家可以与现有的低级控制系统对接，解锁由Gemini Robotics-ER驱动的新功能。

在安全性方面，DeepMind的研究员Vikas Sindhwani透露，公司正在开发一种“分层安全策略”，并已训练Gemini Robotics-ER模型评估在特定情境下某个动作的安全性。同时，DeepMind还发布了新的基准和框架，以推动AI领域的安全研究。去年DeepMind还推出了受艾萨克·阿西莫夫启发的“机器人宪法”，作为机器人的行为规范。

在合作方面，DeepMind与Apptronik携手致力于“打造下一代人形机器人”。DeepMind还向包括Agile Robots、Agility Robotics、波士顿动力和Enchanted Tools在内的多家“受信任的测试者”开放了Gemini Robotics-ER模型。Parada表示：“我们专注于打造能够理解物理世界并在其中行动的智能，非常期待将这一技术应用于更广泛的领域和表现形式。”

发表于: 2025-03-132025-03-13 11:31:16
原文链接：https://page.om.qq.com/page/OQTgxvD4KDL2H0IRcBc_i9LQ0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

谷歌DeepMind新AI：机器人无需训练，也能执行现实复杂任务？

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐