首页
学习
活动
专区
圈层
工具
发布

谷歌申请使用多模态语言模型的开放词表机器人控制专利,用于控制与环境交互的智能体

国家知识产权局信息显示,谷歌有限责任公司申请一项名为“使用多模态语言模型的开放词表机器人控制”的专利,公开号CN120604238A,申请日期为2024年02月。

专利摘要显示,用于控制与环境交互的智能体的方法、系统和设备,包括被编码在计算机存储介质上的计算机程序。在一个方面,一种方法包括:接收环境的观察图像;接收输入文本序列;生成包括观察图像的对象定位输入;使用对象定位神经网络来处理对象定位输入以生成对象定位输出,该对象定位输出标识观察图像中的一个或多个对象的相应位置;基于观察图像、输入文本序列和对象定位输出来生成策略输入;使用策略神经网络来处理策略输入以生成策略输出,该策略输出定义智能体响应于观察图像而要执行的动作;使用策略输出来选择智能体要执行的动作;以及使智能体执行所选择的动作。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

来源:市场资讯

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OmBD-6wlKKCErREPQh92NilA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券