前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AI玩起音乐来“天赋”惊人,新版加州旅馆听过没?还是熟悉的老鹰乐队嗓音

AI玩起音乐来“天赋”惊人,新版加州旅馆听过没?还是熟悉的老鹰乐队嗓音

作者头像
量子位
发布2020-05-19 16:03:21
2870
发布2020-05-19 16:03:21
举报
文章被收录于专栏:量子位量子位
赖可 发自 凹非寺 量子位 报道 | 公众号 QbitAI

AI把一首歌重新唱一遍,会是什么感觉?还是那个歌手,还是那个歌词,却是全新的旋律,全新的风格。

先试听一下吧。

Eagles乐队的Hotel California,第一段还是原调,唱着唱着就突然变了:

第一遍听没有听歌词,真的以为变成了另一首歌,最后还加了一段纯乐器:

On a dark desert highway,cool wind in my hair Warm smell of colitas, rising up through the air Up ahead in the distance, I saw a shimmering light My head grew heavy and my sight grew dim(开始变调) I had to stop for the night There she stood in the doorway I heard the mission bell And I was thinkin’ to myself ‘This could be heaven or this could be hell (music……)

虽然不熟悉,还真的蛮好听,这个AI乐感不错呀!(反正超过我了)

最新的合成器:Jukebox

AI科学家一直在尝试,用神经网络合成语音和音乐。

上面的歌曲你也听过了,它是Open AI 最新研究出的神经网络:Jukebox。 它将乐器和人声的混合的复杂音频,进行再处理,尽可能追求顺畅效果。

我们之所以选择音乐工作,是因为我们希望继续突破生成模型的界限。

它是怎么实现的呢?

Jukebox使用了一种称为VQ-VAE的量化方法,将音频压缩到离散空间。 分层VQ-VAE可以从几个演奏的样本中生成简短的乐器片段。

分层处理

所谓的分层方法,就是分为三层将44kHz原始音频压缩为8x,32x和128x。 主要有两个步骤。

压缩:每层都独立地进行编码。底层编码进行重构,而顶层编码只保留了基本的音乐信息。

生产:也是分层进行,一系列的transformers会从上到下生成代码,最后,下层的解码器将它们转换为原始音频。

当然,能生成目前效果的歌曲,也是因为数据库足够丰富,看一眼就知道了:

传送门

目前这个神经网络也有局限,产生不了常见大型音乐结构,例如和声和重复。科学家还在进一步努力中。

如果你想听更多其他AI制作的音乐样本,可以去官网试试:

https://openai.com/blog/jukebox/#rf7

一个小彩蛋:发现了一首深度学习之歌

Deep learning ,deep learning The deeper you learn, the smarter your A. I. Deep learning, big data Big model, accuracy We must, we must, we must go deeper …………

作者系网易新闻·网易号“各有态度”签约作者

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 最新的合成器:Jukebox
  • 分层处理
  • 传送门
相关产品与服务
文件存储
文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档