首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

华创派|梅卡曼德Mech-GPT多模态大模型:让机器人能够通过自然语言交互,并综合视觉和语言指令进行推理

梅卡曼德深耕AI+3D视觉技术,通过性能强大的智能机器人产品、完善的服务体系、开放共赢的合作理念,帮助更多企业实现了智能化、柔性化生产。目前,已服务全球汽车、物流、重工、3C等行业头部客户,全球累计落地10000+台相机,业务覆盖全球五十余国家及地区。

梅卡曼德与张建伟院士展开深度合作,双方共同探索具身智能前沿技术,推出了Mech-GPT机器人多模态大模型。Mech-GPT具备高泛化能力和通用能力,赋予机器人类人的学习、理解、推理及决策能力。通过Mech-GPT,操作员可通过自然语言指令,让机器人完成复杂任务,而无需复杂编程和专业知识。智能机器人有望被应用到每一个行业。

使用机器人一直是一项非常专业且耗时的任务。为了让机器人进行一项任务,往往需要工程师花费数天甚至数周时间进行编程,且需要很多专业知识。这样显然难以应对快速、频繁切换产品的制造业场景,以及更复杂多变的服务业和家用场景。

Mech-GPT使机器人能够理解自然语言下达的指令,通过自然语言与操作员交互

Mech-GPT使机器人能够快速理解模糊、复杂的语义指令,通过自然语言与操作员交互,并执行复杂任务

Mech-GPT多模态大模型让机器人能够理解自然语言指令,并综合视觉、图纸等多模态信息进行推理决策,智能决定如何完成任务。任何人都可以通过自然语言在非常短的时间内让机器人执行复杂任务,且无需复杂编程和专业知识。机器人可认识常见物品,且操作员可通过自然语言指挥机器人对特定类别的物体进行操作。Mech-GPT的应用不局限于某一种机器人,它可为人形、服务、协作及工业机器人在内的各种机器人提供了高阶智能,使机器人操作更高效、更智能。

免训练高速物体抓取

透明物体抓取

透明物体、反光物体、大尺寸料筐物体高质量点云

梅卡曼德自主研发的3D视觉传感器及智能软件像是机器人的“眼睛”,使机器人能够精准获取物体三维信息,识别物体种类和位置,并规划动作路线。公司在物体成像、视觉识别、机器人等AI算法方面积累深厚,已掌握透明物体成像、强反光物体成像、超大物体成像,和免训练高速物体抓取等先进AI技术,让机器人可处理各类复杂情况。

梅卡曼德已在全球部署10000+智能机器人应用

虚拟环境模拟物理世界真实场景

机器人多模态大模型训练需要庞大数据。梅卡曼德已在全球50余个国家和地区部署了超过10000台智能机器人视觉设备,广泛应用于物流、制造等场景,处理过超十万种各类物品,积累了大量实际数据及经验。通过大量真实场景数据和自主训练,机器人可以抓取海量种类的物品,且无需事先注册或额外训练。同时,利用虚拟环境仿真物理世界中的各类真实场景,机器人可以获取更丰富的训练数据。

在这些基础上,我们正在通过Mech-GPT多模态大模型,让机器人能够理解自然语言所下达的指令,理解人类的意图,并综合视觉和图纸信息进行更复杂的推理和决策,应对更复杂多变的场景,完成用户指定的随机任务。相较于传统工业机器人的编程调试方式,机器人的使用门槛将极大降低,可适应制造业中需要快速、频繁换型的场景及物流、服务等行业中更复杂多变的场景。

Mech-GPT广泛的应用领域

Mech-GPT可适配各种机器人和工具,而不仅仅局限在某一种硬件上,从而具有更广泛的适应性。从工业、物流、零售、农业生活、科研,智能机器人可被应用于任何领域,完成多种多样的任务。通过与张建伟院士和梅卡曼德强强联手,我们相信,智能机器人将走进千行百业,成为人人可用、处处可用的智能帮手。

了解更多,敬请关注

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O0VyGCWDgr2_wcuyznO24wtg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券