首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Meta:但是这个可以从音频文件创建图像的新 AI 是什么?

kovop / Shutterstock

Facebook 的母公司 Meta 推出了 ImageBind,这是一种新的人工智能模型,它以其多功能性而闪耀,并在纸面上显示出非常有前途的创造力。

马克·扎克伯格 (Mark Zuckerberg) 于 5 月 9 日星期二展示了一个全新的开源多模式AI 模型,该模型隶属于他的团队的 Meta AI 部门。ImageBind,顾名思义,具有惊人的特性,因为它能够通过组合多达六种类型的数据来创建内容,使机器更接近人类,以及它们同时、整体学习的能力。

ImageBind,Meta 的 6 种感官 AI

“  ImageBind 是一种新的 AI 模型,它结合了不同的感官,就像人一样 ,”Facebook 的创始人总结道。这里的人工智能能够链接来自六种不同模式的信息:文本、视觉、音频、运动、热和深度数据。

该模型实际上可以超越以前的专门模型,这些模型是针对这种或那种模式单独训练的。此外,它有助于改进和推进人工智能,因为它允许机器分析不同种类的信息。

让我们以 Make-A-Scene 为例,Meta 的生成式 AI 可将文本和草图转换为艺术作品。使用 ImageBind 模型,它可以从音频文件或数据创建图像。在他的 Facebook 帐户上发布的一段视频中,马克·扎克伯格 (Mark Zuckerberg) 给出了动画图像的示例,这要归功于 4 种模式的组合,包括书面请求、“小动物”、森林雨声或森林照片. 结果令人震惊,观看:

受人类能力启发的人工智能

“  ImageBind 是 Meta 致力于创建多模式 AI 系统的一部分,该系统可以从周围所有可能类型的数据中学习 ,”该公司表示,并补充说,随着模式数量的增加,越来越多的研究人员发现他们开发新的整体系统的能力也在提高。

对于传统的人工智能系统,每种模式都有特定的集成。ImageBind 表明可以跨多种模态创建一个通用的集成空间,而无需使用每种不同的模态组合对数据进行训练。如您所知,此模型可以通过以其他输出格式恢复它们,为您的文件、图像和查询赋予新的生命。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230511A02VW000?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券