首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

微软开源多模态AI Agent模型Magma 购物时可自动下单

【太平洋科技快讯】微软在官网开源了一款名为Magma的多模态AI Agent基础模型。与传统AI Agent相比,Magma具有跨越数字和物理世界的能力。它能够自动处理图像、视频、文本等多种类型的数据,实现不同领域的信息融合。

作为视觉语言动作(VLA)基础模型之一,Magma能够从海量的公开视觉和语言数据中学习知识,融合语言、空间和时间智能,应对数字和物理世界中的复杂任务和环境。Magmahai 内置了心理预测功能,这使得它能够更准确地预测视频中人物或物体的意图和未来行为,这一功能大大提高了AI对未来时空动态的理解能力。

这款模型的应用前景十分广阔。用户可以利用它自动下电商订单、查询天气,甚至操控实体机器人。在真实象棋游戏中,Magma也能为用户提供助力。此外,Magma还能够帮助AI驱动的助手或机器人更好地理解周围环境,并采取相应行动。例如,它可以帮助家用机器人学习整理新物品,或为虚拟助手生成用户界面导航说明。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OqNX1bkEH4MuboTGOz6iAjCw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券