专栏首页DT数据侠我们爬取了Billboard数据,发现了乐坛“造星法则”

我们爬取了Billboard数据,发现了乐坛“造星法则”

什么样的歌手在音乐制作公司眼中最受市场欢迎,且最能给公司带来收益?什么因素会影响这些艺术家们的表演?数据侠Weijie Deng这次自己当了一回音乐经纪人,用数据分析寻找Billboard下一个有潜力的音乐之星。

喜欢音乐的朋友,一定都很熟悉Billboard排行榜,这是一个音乐人在专业领域所取得的成就的证明。

我爬取了Billboard的数据,想了解为何有些音乐人可以长时间保持创造力和流行度;同时,我还尝试为音乐公司寻找具有同样潜质的音乐人。

我们先快速浏览一下总体数据分布。x轴上是每一个歌手,y轴是他们在榜单的出现次数。

(图片说明:X轴是歌手,但是由于数量众多无法显示。不过不用担心,这里只需要观察趋势即可,并不具体到某一位歌手。)

这是1990到2017年所有上过Billboard的歌手情况。我们可以看到,只有少于50%的歌手可以再次出现在Billboard上。然而,一少部分歌手却可以经常出现在榜单中。我对这部分歌手感到好奇。我首先分析了他们所属的音乐风格。

2000年后,流行乐和嘻哈乐歌手最多。我们可以看到,2014年后流行乐歌手数量出现下降,不过整体的趋势还是增长的趋势。嘻哈乐与流行乐很像,在1990到2000年期间并不是最受欢迎的,但2002年后增长迅猛。

R&B和摇滚乐在2007年以前曾经非常受欢迎,但我们可以看到整体趋势在变差。大体上,R&B还是比摇滚乐好一点,R&B歌曲比摇滚乐歌曲出现的更多些。

电子乐和乡村音乐同样值得关注,电子乐最近变的更受欢迎。

对各类音乐类型分开研究后,我们也想看一下不同音乐种类之间进行对比的情况。

这是仅出现过一次的歌手的数据图。

我们可以看到,最受欢迎的是嘻哈乐,其次是流行乐。2005年之后这两类音乐类型几乎统治了榜单。2005年以前,市场的分布更加均衡,摇滚乐彼时也是一个主流的音乐类型。

这是在榜单出现过多次的歌手的数据图。

虽然流行乐和嘻哈乐仍然占了主流。最近两年,电子乐从流行乐和嘻哈乐手上抢走不少份额。2016和2017年,电子乐在全部类型中排名第三。

在上述分析中我发现一个有趣的现象,只出现过一次的歌手所属的音乐类型,在跟随多次出现的歌手在音乐类型上呈现的趋势而变化。比如,2015年出现最多的音乐类型,往往会是下一年仅在榜单出现一次的歌手所属的音乐类型中最多的。也就是说,如果你是一个新人歌手,与其选择自己的曲风,不如模仿前一年最流行的音乐曲风打造乐曲,从而更容易在Billboard上崭露头角。

因此,我好奇歌手的创造力和创新能力是否是一个重要因素。我决完看一看有多少歌手自己写歌。

从这个回归分布看出,尽管有一些波动起伏,歌手自己写歌的大的趋势依然呈现增长。

如果公司考虑短期收益,他们可以与那些属于最近最受欢迎音乐类型的艺人签约。但如果想追求长期收益,那些创作型、能创造属于自己风格的东西的歌手则是更好的选择。

注:本文翻译自《Looking For The Next Profitable Singers》,内容仅为作者观点,不代表DT财经立场。

作者 | Weijie Deng

题图 | 站酷海洛

▍关于DT×NYCDSA

DT×NYCDSA是DT财经与纽约数据科学学院合作专栏。纽约数据科学学院(NYC Data Science Academy)是由一批活跃在全球的数据科学、大数据专家和SupStat Inc. 的成员共同组建的教育集团。

▍数据侠门派

本文作者 Weijie Deng 是纽约数据科学学院学员,弗吉尼亚理工大学会计与信息系统硕士。

本文分享自微信公众号 - DT数据侠(DTdatahero),作者:纽约数据科学学院

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-05-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Lady Gaga和麦当娜谁才是gay圈女神?emoji数据啥都知道

    即时聊天工具如此普及的今天,各种emoji表情被网友们玩坏了。一个小小的表情包,却可以传递某种难以言说的情感,成了一种世界共通的语言。在全球最大音乐流媒体播放平...

    DT数据侠
  • 让数据帮你找到属于自己的“忠实粉丝”

    层出不穷的音乐社区网站,打破了传统的媒体“造星方式”,越来越多的平民歌手通过社区网站上传和发表自己的音乐作品,来获取品味相投的粉丝。但平民歌手想要“火”,离不开...

    DT数据侠
  • 地铁数据下的真实生活:通勤缩短三分钟,房价贵出一辆车

    根据中原集团研究中心分析,每距离办公区域近一站地铁,或者说缩短三分钟上班路程,上海的一套房均价就要抬高18.75万元,相当于一辆普通轿车。在11月30日的“20...

    DT数据侠
  • Lady Gaga和麦当娜谁才是gay圈女神?emoji数据啥都知道

    即时聊天工具如此普及的今天,各种emoji表情被网友们玩坏了。一个小小的表情包,却可以传递某种难以言说的情感,成了一种世界共通的语言。在全球最大音乐流媒体播放平...

    DT数据侠
  • SpringBoot如何使用注解装配Bean

    在日常开发中,项目中大量的Bean的装配。今天就来聊聊如何使用注解装配Bean。这里与其说是SpringBoot装配Bean还是不如说是Spring注解来装配B...

    田维常
  • LeetCode 873. 最长的斐波那契子序列的长度(动态规划)

    给定一个严格递增的正整数数组形成序列,找到 A 中最长的斐波那契式的子序列的长度。如果一个不存在,返回 0 。

    Michael阿明
  • web应用配置多环境(Nginx转发方式)

    客户端可以不写具体接口地址,通过服务器控制指向不同的地址从而达到多环境。 通过配置nginx/conf文件,处理转发分配不同环境的前端代码

    程序员不务正业
  • Git 2.25.0发布,不用再clone整个仓库了!

    Git 2.25.0 发布了,项目贡献者 Taylor Blau 介绍了此版本带来的一些特性上的亮点,包括部分克隆(partial clone)与稀疏检出(sp...

    xcbeyond
  • R语言作图——Split violin plot

    最近小仙同学在好几篇文献里看到了这种小提琴图,暂时就肤浅地认为这是作者为了更好地比较对照组与实验组的差别,所以将同一个基因的小提琴图各画了一半,放在一起。为了跟...

    一只羊
  • 用SAS编一个回归软件 | 【SAS Says·扩展篇】IML:作业 | 数说·语言

    上次Ansta留给自己的作业是: Sashelp逻辑库中有一个关于GNP的数据sashelp.gnp,要求用1961、1962、1963三年的数据建立回归模型...

    数说君

扫码关注云+社区

领取腾讯云代金券