首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python 词云分析周杰伦新歌《说好不哭》

看我公众号头像就知道是杰伦粉了 ,高中的时候开始喜欢上了他的歌,一晃都这么多年了,我整理了他所有的歌曲和部分电影/演唱会视频,可以在公众号回复 获取,2个多小时的2004 无与伦比演唱会看了n遍。

下面开始用词云来分析杰伦这首歌都写的什么内容。

词云

词云,又称文字云,由词汇组成类似云的彩色图形,用于展示大量文本数据,就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”,从而过滤掉大量的文本信息,使浏览者只要一眼扫过文本就可以领略文本的主旨。

歌词

先看看这首歌的歌词,在QQ 音乐上可以找到https://y.qq.com/n/yqq/song/001qvvgF38HVc4.html

先把歌词保存到文件 no_cry.txt ,然后用Python的wordcloud来分析 。

wordcloud

wordcloud 是Python的一个扩展包,直接使用pip install wordcloud来安装。https://github.com/amueller/word_cloud

保存到本地的文件 no_cry.jpg图片效果:

改变下尺寸效果

接着看看这首歌的主要关键词

关键词如下:

然后加个白色背景

效果图

wordcloud_cli

如果你不想写代码 ,可以直接用命令行工具wordcloud_cli , https://amueller.github.io/word_cloud/cli.html 可以看看命令行参数

直接执行 ,生成图片效果

下面再以周杰伦于2003年发行的专辑《叶惠美》为例,共收录了11首歌曲

百科地址https://baike.baidu.com/item/%E5%8F%B6%E6%83%A0%E7%BE%8E/893近600行歌词,保存到文件 jay.txt

效果图:

这张专辑的主要关键词

如果你不会代码怎么生成词云呢,有许多对应的网站。

wordart

一个在线生成词云的网站 https://wordart.com/create 将文字导入进去

然后上传中文字体,否则乱码,效果如图:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20191025A03PXM00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券