首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大数据告诉你,究竟哪种乐器才是乐器之王

1. 王位纷争

有这样一种说法,钢琴是 “乐器之王”。

的确,钢琴拥有宽广的音域,仅凭一件乐器,就能Cover 住整个管弦乐队的音域。

加之其普及程度高,学习者甚众,这 “乐器之王” 的美名也算实至名归。

然而,对于钢琴这个王位的合理性,全世界的朋友们看法都是一致的吗?

当我问 Google 这个问题时,Google推荐算法给我的排名是这样的

呼声最高的 “王位竞争者” 是管风琴,其次是小提琴,再次是莫扎特(大雾),钢琴连前三都没挤进去,只排在第四位。

也有道理,管风琴的音域不输钢琴,且在音量和气势上碾压钢琴;而小提琴,虽然我们一般称其为 “乐器之后”,可它诞生的时间要比钢琴早两个多世纪,按道理讲,有王才有后嘛。

如此说来,竖琴也有资格挑战这个称号,它的历史要比钢琴和小提琴加起来还长好几倍。

而论及普及程度,吉他又站了出来,本乐器携带方便,学习曲线平缓,练上个把月就能弹出简单的曲子出去撩……

争论 “究竟哪种乐器才是乐器之王” 这个命题,永远都不会有确切的答案。

所以我们换个问法:

在不同的历史时期,哪种乐器的影响力最大?

这个切入点,就好下手多了。

2. 王位争霸赛

(为了不干扰文章阅读,本文数据处理过程及细节均放在文末)

钢琴、小提琴、吉他、管风琴、竖琴,前文提到的这五种乐器,就是参与今天 “乐器之王” 争霸赛的五位选手。

1号选手钢琴,诞生于1709年,由意大利人巴托罗密欧·克里斯多佛利(Bartolomeo Cristofori,1655-1731)发明。

2号选手小提琴,诞生于文艺复兴时期(约16世纪),发明人不详。

3号选手吉他,祖先诞生于公元前3000年的古埃及,曾用名 “琉特琴 (lute)”、“比维拉琴 (Vihuela)” 等,13世纪在西班牙登记为现在的名称 “吉他 (guitar)”

4号选手管风琴,诞生于公元前250年,由古罗马人发明。

5号选手竖琴,诞生于新石器时代,跟我们会用火的时间一样长。

选手介绍完了,比赛开始。

3. 1750 - 1850

从图中可以看到,1750 到1850 这 100 年间,这五种乐器的热门程度基本上是相持不下的。

在这个时间段的早期,管风琴处于优势地位,而钢琴作为乐器界的后起之秀,在19世纪30年代左右迅速流行起来,到了1850年,已成为乐器界最炙手可热的明星。

这段时间,恰恰也是钢琴界最早一批明星活跃的年份,李斯特、肖邦等钢琴巨星对于这种乐器发展的巨大影响,不仅存在于乐评家的文字中,从客观数据上也可见一斑。

在钢琴开始流行之前,19世纪20年代开始,有一种神秘乐器超力压所有五位选手,就是图中那条天蓝色的线。

大家猜猜看,这件神秘的乐器究竟是什么呢?

4. 1850 - 2000

1850年后,钢琴的发展势不可挡,成为当之无愧的 “乐器之王”,而竖琴、管风琴及那种神秘乐器逐渐风头不再。

小提琴呢,20世纪70年代前,乐器圈儿二当家的地位一直十分稳定,可没想到没几年的时间,就被吉他迎头赶上。

吉他的数据表现非常具有戏剧性,从图中可以看到,吉他蓬勃发展的开始,有一个非常明显的拐点,这个拐点出现的时间是1957~1958年。

究竟是什么事件或是什么人物,仅用了两三年的时间迅速捧红了这种乐器?

我试着回溯这段时间的相关记录,然而并没有有价值的发现。

朋友们,你们的观点是什么呢?

5. 全局

为什么我要分两个时间段来讨论这个问题呢?我又为何会选择1850这个时间点来进行划分呢?

看过下面这张图,我想朋友们会秒懂。

19世纪50年代,这个时间,不仅仅是钢琴一种乐器腾飞的年代,所有乐器的影响程度均开始大幅度提升。

如果我不以1850年做切分,这之前的数据,几乎看出不什么差别。

除去 “乐器之王” 地位的演变,这笔数据还告诉我们这样一个事实:

随着时代的发展,音乐在人们日常生活中的地位越来越重要。

这句话不再是一句纯粹的鸡汤,现在,它有了客观数据支持。

6. 数据处理细节

「古典音乐大数据」项目,我并不是第一次做。

要回答今天这个问题,这批数据无论从时间跨度还是数据广度,都已不再适用。

这次我用到的数据源,是 Google Books 的 Ngram Viewer 项目。

简单讲,就是 Google Books 将其收录的,从1500年到2000年间,共60多万本书电子化,而后进行自然语言处理 (NLP),最后将其结果开源出来,供计量史学、语义学、社会学等研究领域使用。

如此,我们就能搜索特定词汇在某一年所有书籍中出现的词频。

举个例子,天堂 (heaven) 和地狱 (hell) 这两个词,自1800 年以来词频的变化趋势是这样的。

可以看到,地狱稳定不变,天堂自1830年后持续下降,终于在20世纪80年代跌穿地狱。(看来80后的生活是地狱模式,原来是有理论依据的)

这个数据,大致能反映这个词汇在相应时间段中的影响力。

这个探索项目中的数据处理细节如下:

1、数据集选用

选取的是 Google Books Ngram Viewer 项目中英文非虚构类作品数据集。

2、关键词选取

英语 “organ” 既有管风琴之意,又可以解释为 “器官”、“机构”;

英语 “harp” 既有竖琴之意,又可以翻译为 “喋喋不休”、“不住地说”。

为避免歧义,本项目中使用如下形式获取数据 “play=>guitar_NOUN”,即 “弹奏某乐器” 。

3、数据解释

Google的处理方式是N元模型 (n-grams) 消歧义,展示数据精度为e^-8。

大家如果有其它探索创意和想法,也可以留言给我,相信这个项目中一定能挖掘出更多有意思的结果和真相!

祝大家赏乐愉快!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180211A13LQ200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券