首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

谷歌DeepMind新AI:机器人无需训练,也能执行现实复杂任务?

谷歌DeepMind在人工智能领域再次迈出重要一步,近日推出了两款专为现实世界任务设计的AI模型,旨在增强机器人的功能与适应性。

其中一款名为Gemini Robotics的模型,凭借其强大的视觉语言行动能力,让机器人无需特定训练即可理解并应对全新的情境。这款模型基于DeepMind的最新旗舰AI——Gemini 2.0构建。据DeepMind机器人部门的高级总监Carolina Parada介绍,Gemini Robotics通过整合Gemini的多模态世界理解能力,并加入物理行动的新模态,成功实现了向现实世界的拓展。

Gemini Robotics在构建高效机器人所需的三大核心领域——通用性、互动性和灵活性上取得了显著进展。它不仅能够灵活应对各种新情境,还在与人类及环境的互动中展现出更出色的表现,甚至能够执行如折纸、打开瓶盖等精细的物理操作。

另一款新模型名为Gemini Robotics-ER(具象推理),DeepMind将其描述为一种能够“理解复杂且动态世界”的先进视觉语言模型。Parada进一步解释,当执行如装便当盒等任务时,机器人需要考虑桌上物品的位置及操作步骤,而Gemini Robotics-ER正是为解决此类推理任务而设计的。通过该模型,机器人专家可以与现有的低级控制系统对接,解锁由Gemini Robotics-ER驱动的新功能。

在安全性方面,DeepMind的研究员Vikas Sindhwani透露,公司正在开发一种“分层安全策略”,并已训练Gemini Robotics-ER模型评估在特定情境下某个动作的安全性。同时,DeepMind还发布了新的基准和框架,以推动AI领域的安全研究。去年DeepMind还推出了受艾萨克·阿西莫夫启发的“机器人宪法”,作为机器人的行为规范。

在合作方面,DeepMind与Apptronik携手致力于“打造下一代人形机器人”。DeepMind还向包括Agile Robots、Agility Robotics、波士顿动力和Enchanted Tools在内的多家“受信任的测试者”开放了Gemini Robotics-ER模型。Parada表示:“我们专注于打造能够理解物理世界并在其中行动的智能,非常期待将这一技术应用于更广泛的领域和表现形式。”

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OQTgxvD4KDL2H0IRcBc_i9LQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券