以假乱真:机器学习是怎么写出圣诞歌的?

日前,数据专家提姆·布什利用机器学习算法写了首圣诞歌词,让古老的圣诞节充满了浓浓的AI 特色。

如何用大数据写出一首圣诞歌曲(来自Lynchpin)

AI 训练的数据来源于哥伦比亚大学拥有的百万首曲库,不过数据库太大,他最后选择了一个可以管理每个关键词的元数据库。利用SQL查询算法选出带有“圣诞节”“圣诞老”“Xmas”“驯鹿”“响叮当”等关键词,就可以获得3136首歌曲。

歌曲时常多少比较好呢?数据显示最长的圣诞歌有16.5分钟,最短的是来自1995年The Wiggles专辑中的一首If you see Santa,只有11秒。不过圣诞歌曲的均时长比一般歌曲均时长短。

对圣诞歌曲的时长分析(来自Lynchpin)

为了写出最受欢迎的歌词,提姆用Python的自然语言工具分析了50首最佳圣诞歌的歌词内容。

他还使用集群算法对歌词进行了聚类分析,歌词内容明显出现了三类风格,圣诞流行歌(提到Santa标红星、没有提到Santa的标黄星)和圣诞颂歌(紫星)。提姆创作的圣诞歌是机器学习随机产生的,基本韵律和意象都有,还需稍加润色,为歌曲添加一些抒情意义。

MDS图显示的是不同歌词的相似程度,每个数据点代表一首歌,越近代表越相似。(来自Lynchpin)

最后,一首《幸福就在落雪时》的圣诞歌就出炉啦:

【树在吟唱,似岁月流逝,当雪落之时,圣诞即至。

幸福就在落雪时,我的圣诞宝贝

我只想你知晓,遇见你之前,我只是一棵树

没有雪花妆点,歌唱也无知音,我怎会让你离开

幸福就在落雪时,我的圣诞宝贝】

你相信这是机器写出来的吗?简直到以假乱真的地步啦!不过这还不是happy ending哦,提姆还在计划用机器学习分析库中歌曲的旋律和节拍,说不定明年12月,你就能听到一首蕴含着科技感的圣诞旋律啦。

本文编译:秋慕小

原文来源:lynchpin

喜欢我的内容就关注我吧~ 咱们天天相守

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20171226A0LMHB00?refer=cp_1026

同媒体快讯

相关快讯

扫码关注云+社区