首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

VLA进化到ViLLA,智元机器人发布首个通用具身基座大模型GO-1

蓝鲸新闻3月10日电,今日,智元机器人发布首个通用具身基座模型——智元启元大模型(Genie Operator-1),它提出了Vision-Language-Latent-Action (ViLLA) 架构,该架构由VLM(多模态大模型)+ MoE(混合专家)组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力,三者环环相扣,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体。(蓝鲸新闻 翟智超)

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O2_ZDTSWHKBwRhaZLpc3Wi1A0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券