Meta：但是这个可以从音频文件创建图像的新 AI 是什么？

文章来源：企鹅号 - 科技天下汇

kovop / Shutterstock

Facebook 的母公司 Meta 推出了 ImageBind，这是一种新的人工智能模型，它以其多功能性而闪耀，并在纸面上显示出非常有前途的创造力。

马克·扎克伯格 (Mark Zuckerberg) 于 5 月 9 日星期二展示了一个全新的开源多模式AI 模型，该模型隶属于他的团队的 Meta AI 部门。ImageBind，顾名思义，具有惊人的特性，因为它能够通过组合多达六种类型的数据来创建内容，使机器更接近人类，以及它们同时、整体学习的能力。

ImageBind，Meta 的 6 种感官 AI

“ ImageBind 是一种新的 AI 模型，它结合了不同的感官，就像人一样，”Facebook 的创始人总结道。这里的人工智能能够链接来自六种不同模式的信息：文本、视觉、音频、运动、热和深度数据。

该模型实际上可以超越以前的专门模型，这些模型是针对这种或那种模式单独训练的。此外，它有助于改进和推进人工智能，因为它允许机器分析不同种类的信息。

让我们以 Make-A-Scene 为例，Meta 的生成式 AI 可将文本和草图转换为艺术作品。使用 ImageBind 模型，它可以从音频文件或数据创建图像。在他的 Facebook 帐户上发布的一段视频中，马克·扎克伯格 (Mark Zuckerberg) 给出了动画图像的示例，这要归功于 4 种模式的组合，包括书面请求、“小动物”、森林雨声或森林照片. 结果令人震惊，观看：

受人类能力启发的人工智能

“ ImageBind 是 Meta 致力于创建多模式 AI 系统的一部分，该系统可以从周围所有可能类型的数据中学习，”该公司表示，并补充说，随着模式数量的增加，越来越多的研究人员发现他们开发新的整体系统的能力也在提高。

对于传统的人工智能系统，每种模式都有特定的集成。ImageBind 表明可以跨多种模态创建一个通用的集成空间，而无需使用每种不同的模态组合对数据进行训练。如您所知，此模型可以通过以其他输出格式恢复它们，为您的文件、图像和查询赋予新的生命。

发表于: 2023-05-112023-05-11 10:34:29
原文链接：https://kuaibao.qq.com/s/20230511A02VW000?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

Meta：但是这个可以从音频文件创建图像的新 AI 是什么？

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐