专栏首页量子位利用人工智能“解锁”世界音乐

利用人工智能“解锁”世界音乐

颜萌 编译整理 量子位 出品 | 公众号 QbitAI

人们喜欢感受的是音乐带来的那种氛围。

整理过歌单的任何人都知道,好的歌单往往有一种贯穿始终的情感。那就是为什么Gracenote的音乐数据专家已经早早地将音乐按照心情和感情区分。

稍有不同的是,Gracenote的团队不是把数据库里面1亿首歌逐个听下来,而是教计算机去探测情感,使用机器学习和人工智能去判断一首歌的风格是梦幻还是阴郁,又或者是有着淡淡的忧愁。

Gracenote的音乐总经理Brain Hamilton在最近的一次采访中说到,“机器学习是我们的一个战略优势”。

早在10年前,Gracenote就开始在做声音的情绪分类。直到现在,更多的传统算法发展成先进的神经网络,音乐产业也正在越来越多地依靠人工智能,而Gracenote就是最好的样例。

采用这种人工智能分类音乐情感的技术的关键问题在于AI不知道人的感觉。

“我们不知道一种音乐会对每一个个体产生什么样的效用”,研究部副总裁Markus Cremer在美国娱乐界杂志巨头Variety的采访中说。

Gracenote试图将情感的评判标准转换成音乐家的创作目的,他们觉得创作者的目的才是音乐背后的一种连续的情感品质,换句话说,这家公司想教会计算机去识别音乐背后的深刻感情,而不是纠结于音乐对某个个体唤起的回忆。

教计算机去识别音乐中包含的感情的过程有点像治疗:首先要给情感命名。

Gracenote的音乐团队最开始使用的分类中包括了超过100种的气氛和情感,后来扩展到400多种。其中的一些有明确的情感分类,也有像“声色犬马”或“绝望的狂暴能量”这样过于细致的描述。新的分类也在不断的加入。这是一种迭代的过程,这些分类在迭代中不断的优化。

除了这些心情清单,Gracenote也有一些为机器学习准备的训练集,音乐专家们把4000多首歌收集分类后,编制训练集本身就是一种艺术,“我们只需要保证给的音乐的例子是人们正在听的,同时那些选出来的歌也要对某一种情感具有充分的代表性,不能模棱两可,“DiMaria说。

目前的训练集里面用Lady Gaga的《Love Game》代表“性感的摇滚”,Radiohead的《pyramid song》代表“哀愁”,Beyonce的《Me,Myself&I》作为“熟悉的,轻柔而感性的”曲风的代表。

情感种类和训练集都需要不断的更新,因为艺术家们在不断地创造新的曲风,尤其对电音和hip-hop这些更新很快的曲种来说。

系统受到训练后就会被放到数百万的歌曲堆中去听了。计算机不仅仅一条条听,还把每一首歌切成700微秒的片段,然后从任意一个切片中提取出170多种声音的品质。另外,系统有时也会调用大段的音乐片段来分析一首歌的旋律或类似的特征,然后把这些值和既有的数据作比较来归纳一首歌的情感。这样下来最后的结果就不是一种单一的心情,而是某一类心情的概括。

要把所有的歌打乱重新归类是一件很复杂的事情,Gracenote的团队必须周期性维护,保证过程不出错。

计算机要听很多东西,除了乐器,声道,一层叠加到另一层的效果,还包括一些本身不是音乐的一部分的声音,比如为车载立体声或互联网流媒体优化过后的结果。

Cremer说这个系统也会可以捕获一些意料之外的东西,它会在无监督的状态下可以自己决定去注意一些压缩失真,然后和心情匹配起来。他开玩笑说,它或许会决定”都是96kbps的速度,所以这让我感到伤心“。

Gracenote一旦做好了音乐的分类,就将数据传送给客户,并以多种不同的方式使用。

一些小的媒体服务获得这些数据的授权后应用于端对端的音乐组织和推荐系统,如iPhone上的一个远程流媒体播放软件 Plex使用该公司的音乐推荐技术,来为用户提供个性化的播放列表或“心情电台”。

这个行业最大的一些音乐服务运营商也在使用这些数据,包括Apple和Spotify,但这些大玩家们不喜欢谈论他们是怎么样把数据用到产品里面的。另外,互联网上大的的流媒体运营商一般倾向于使用自己的音乐推荐算法,但他们也会用这些数据去训练和提升自己的算法。

这些数据的应用意味着音乐迷们可以清楚地了解Gracenote在音乐归类上的工作,而其他人或许不知道这个公司的人工智能技术提升了他们的音乐体验。

不论通过哪种方式,Gracenote都要保证这些数据是在国际上传播的,尤其注重新市场的授权。

8月1日,该公司宣布要在欧洲和拉美出售其音乐产品。另外,为了防止语义信息的丢失,Gracenote还专门雇佣了国际编辑真正去听那些样本歌,来找出和本土文化最为契合的翻译方式。

这种国际眼光还有另外一种形式,就是不断地去国际上搜寻新歌来训练。因此,Cremer说他们目前的状态是”我们的数据可以处理地球上每一张最新的专辑“。

像Gracenote这样的公司要做到对全球的音乐进行分类,就不能仅仅依靠人工,还要靠人工智能和类似机器试听这样的技术。仅靠人工无法对数量庞大的歌曲分类,这样就达不到根据用户最喜欢的音乐生成性化播放列表。而教会电脑去检测则可以帮助人们获得更好更完整的音乐体验。

而使用数据和技术解锁来自世界各地的音乐,是这份工作中最激动人心的部分之一。

本文分享自微信公众号 - 量子位(QbitAI),作者:专注报道AI

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-08-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • ICML新研究提出泛化能力评估新指标:直接上向量余弦距离就OK,还开源了相关代码

    一篇出自比利时天主教鲁汶大学的研究发表在了ICML 2019识别和理解深度学习现象Workshop上。

    量子位
  • 长途货运4大痛,Uber新上的「自动驾驶卡车」如何改善?

    不少人对自动驾驶存在误解。 以为有了这个技术之后,很多司机就被替代掉了。大量以运输为生的司机将会面临失业。 还有人担心自动驾驶技术的安全问题,认为这个技术还没有...

    量子位
  • 王劲和景驰无人车的这半年

    李根 发自 多尔衮王府 量子位 报道 | 公众号 QbitAI ? △ 景驰科技创始人及CEO王劲 北京,南湾子胡同3号,前多尔衮王府,现在是华创资本投资项目...

    量子位
  • 一篇文章带你看懂 Cloudflare 信息泄露事件

    近期根据Hacker News的报道,敏感信息、API 密钥被Cloudflare泄露给了随机的 requesters请求,我们为大家进行深度解读并提供解决方案...

    贺嘉
  • Java 数组最佳指南,快收藏让它吃灰

    两年前,我甚至写过一篇文章,吐槽数组在 Java 中挺鸡肋的,因为有 List 谁用数组啊,现在想想那时候的自己好幼稚,好可笑。因为我只看到了表面现象,实际上呢...

    沉默王二
  • 监控微信小程序wx.request请求失败

    在微信小程序里,与后台服务器交互的主要接口函数是wx.request(),用于发起 HTTPS 网络请求。其重要性不言而喻。然而,却经常遇到请求失败的问题,笔者...

    Fundebug
  • jQuery之模拟实现$().animate()(上)

    (3)inprogress是动画锁 当第一个动画执行时,向Queue中添加锁inprogress,阻止异步调用动画,也就是要求同步执行动画,当动画结束时,移除锁...

    进击的小进进
  • 设计模式--03.观察者模式

    比如一个超市的打折了,需要把消息通知给每一个超市的顾客,这样就可以把超市作为一个被观察者,而顾客是观察者。

    付威
  • 5个基本Linux命令行工具的现代化替代品

    在日常使用 Linux/Unix 系统时,我们会使用许多命令行工具来完成我们的工作,并理解和管理我们的系统,像 du 用于监视磁盘利用率,top 用于显示系统资...

    用户2781897
  • pymongo.errors.CursorNotFound: Cursor not found

    先从数据库中取得所有数据 db[‘test’].find({},{_id:0}),然后对结果进行for循环

    周小董

扫码关注云+社区

领取腾讯云代金券