Python大佬分析了15万歌词,告诉你民谣歌手们到底在唱什么

前几天小编写了两篇利用Python采集网易云歌词和利用Python采集网易云音乐歌曲文章,相信小伙伴们经过实践之后都能够顺利的采集到自己想要听的歌曲。下面的歌词是小编采集的民谣歌词,经过统计,歌词量达到将近15万。

用Python采集的民谣歌词

心血来潮,想利用Python来分析一下民谣歌手们到底在唱些什么鬼~~

首先运用jieba库进行分词和词频统计分析,得到歌词中的词频统计,部分主要代码如下图所示:

运用jieba库进行分词和词频统计分析

得到的词频后将其导入到Excel表格中,详情如下图:

民谣歌手词频统计表

利用词云将其进行可视化,得到效果图如下:

歌词词云可视化

歌词词云可视化

从词频中,我们可以感受到民谣歌手们时常提及青春,感叹韶华易逝,青春小鸟一去不回来。他们会觉得很孤单,但是并不沉浸在忧伤之中,而是心中向往着远方,对整个世界充满希望、对未来充满阳光。嘿嘿,民谣歌手们在传递正能量咧~~

之后通过词频统计分析歌手们喜欢的季节,得到的数据统计如下图所示:

民谣歌手们喜欢的季节

由饼图可以看出,民谣歌手们比较喜欢春天~~等待下一个春天回来;飘在异乡的雪 覆盖了春天~~

继续分析民谣歌手的歌词,探索民谣歌手们到底喜欢活在哪一天,详情如下图所示:

民谣歌手们到底喜欢活在哪一天

由柱状图可以看出,民谣歌手们更加喜欢明天,对于明天充满希望。大家都说我拿青春赌明天,看来是有道理滴。爱人你可感到明天已经来临;却不知明天的船舶停靠在何方~~

通过城市地点词频统计,探索民谣歌手们最喜欢哪个城市,得到的统计图如下所示:

民谣歌手们最喜欢哪个城市

可以很明显的看出,北京直接开挂,完胜其他城市。在南方城市中,民谣歌手念叨最多的还是成都,和我在成都的街头走一走,喔喔喔~~~当然,南京、上海、昆明也有提及,但是分量不大。

那么民谣歌手们到底喜欢南方还是北方呢?看看下图你就知道了。

可以看出来,民谣歌手们还是蛮喜欢南方菇凉的。北方的村庄住着一个南方的姑娘;南方姑娘 你是否习惯北方的秋凉;南方姑娘 你是否喜欢北方人的直爽~~~赵雷歌曲《南方姑娘》送给你^_^

最后利用SnowNLP对每一位民谣歌手的歌词进行情感分析,得到的统计图如下所示:

民谣歌手的情感分析

可以看的出来,许巍的歌曲中表达的情绪是比较嗨的,充满正能量;而赵雷、逃跑计划等人唱的歌曲所表达的情绪比较平缓,像是在不慌不忙的给你讲故事;尧十三等人的歌曲相对忧伤一些。不过话说回来,民谣歌手们的情绪总的来说还是比较开心的。

最后小编总结一下民谣歌手到底在唱什么,唱的是寂寞么?当然不是~~~

通过15万民谣歌词的分析,我们可以得出民谣歌手们时常感叹青春,觉得韶华易逝。通常呢,他们会觉得很孤单,但是并不沉浸在忧伤之中,而是心中向往着远方,对整个世界充满希望、对未来充满阳光。他们喜欢春天和冬天,喜欢生活在明天,对未来充满着信心和希望。他们喜欢北方的城市,尤其是首都北京,但同时呢,他们又惦记着南方姑娘,最希望和女票去的南方城市是成都、南京、中国香港和昆明~~

以上观点仅供大家参考,欢迎大家拍砖~

本文分享自微信公众号 - Python爬虫与数据挖掘(crawler_python)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-10-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习算法与Python学习

实战 | 用Python放一场浪漫的烟花秀!

https://jizhi.im/blog/post/py_make_fireworks

13210
来自专栏小詹同学

Python小知识 | 这些技能你不会?(一)

也很简单,把模式改成”才怪 “,也就是说,在指定格式里加个空格就行,那么,”怪才 “、” 怪才“、”怪 才“都是一个模式,会把字符串前后的”才“、”怪“、” “...

11240
来自专栏AI小白入门

【干货】NumPy入门深度好文 (上篇)

Numpy 是 Python 专门处理高维数组 (high dimensional array) 的计算的包,每次使用它遇到问题都会它的官网 (www.nump...

12920
来自专栏网管叨bi叨

面试题之会议安排

最近工作太忙,自己输入不够所以最近没有输出什么有价值的技术文章。今天分享一个面试题的解法。现在基本上排在第一线的互联网公司面试时都会考算法题,而且题目不是单纯的...

11320
来自专栏志学Python

利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作

针对 Series 的重新索引操作 重新索引指的是根据index参数重新进行排序。如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行。不想用缺失值...

7820
来自专栏数据处理与分析

用Python进行数据分析之数据透视表

在节前的一次推送中,我写了如何使用FME来进行进行数据透视的相关分析。今天来填之前挖的坑,使用Python来完成同样的数据分析。只不过,Py实现起来,更简洁! ...

12630
来自专栏网管叨bi叨

JS module的导出和导入

最近看了些Vue框架写的程序,发现自己的前端知识还停留在几年以前,发现现在Javascript程序里有各种各样的对module的导入和到处,导入乍一看跟pyth...

14040
来自专栏测试游记

c2py试用(一)

转变 C/C++的 .h文件为python模块源文件,所有匹配都基于c++限定名,使用正则表达式。

11420
来自专栏志学Python

利用Python进行数据分析(7) pandas Series和DataFrame简单介绍

pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析。它提供了大量高级的数据结构和对数据处理的方法。pandas 有两个主...

9340
来自专栏一名白帽的成长史

【Coding】聊聊字符编码那些事儿

文本文件中存放的数据在用户读取时可以按照编码类型还原成字符形式,我们可以直接打开,如下:

10720

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励