Python数据分析之定制化网易云音乐歌单数据情况数据分析

最近朋友圈刷疯了的几件事:

圣诞节骗我艾特微信官方戴红帽 老的跟树皮似的骗我晒18岁皂片 明明开挂却骗我自己玩的跳一跳 网易云听歌报告告诉我最爱tfboy 支付宝关键词鄙视我太穷丢它脸

个人特别喜欢听网易云音乐的推荐歌单(个人比较懒),但一个高播放量的歌单里的歌曲,不一定都喜欢,所以我爬取了9万多首歌曲,定制化了自己的网易云音乐歌单,

数据情况

本文爬取了部分歌单,及歌单中的歌曲,如图所示。

数据分析

  • 歌单类别

总共爬取了673个歌单,由于爬虫中断了,并没有爬取所有的类别,但爬取的歌单类别中,分布还是比较均匀的。

  • 最火歌单 通过对播放量的预处理(有的是以万为单位),这里全部统一为万为单位。

周杰伦果然是一代人的回忆,通过排行也可以看出,对于大部分用户来说,华语的播放量还是最多的。

  • 歌手出现次数
  • 歌单推荐 还是前面的问题,通过播放量,只能推荐已有的歌单,但有时候歌单里的歌不是所有的都喜欢听。说下自己的思路,有些歌出现许多次,这样我就给这个歌扩大播放量,这样排序,得到了华语歌曲的歌单。

部分数据

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

3 条评论
登录 后参与评论

相关文章

来自专栏Kubernetes

Golang性能调优(go-torch, go tool pprof)

Go语言已经为开发者内置配套了很多性能调优监控的好工具和方法,这大大提升了我们profile分析的效率。此外本文还将重点介绍和推荐uber开源的go-torch...

5916
来自专栏小樱的经验随笔

CTF---Web入门第七题 猫抓老鼠

猫抓老鼠分值:10 来源: 实验吧 难度:难 参与人数:8697人 Get Flag:3740人 答题人数:3944人 解题通过率:95% catch!catc...

3195
来自专栏MelonTeam专栏

google cloud--穷人也能玩深度学习

导语:想玩深度学习但是没钱更新电脑配置怎么办?google cloud,只要1美元,只要1美元,300美元赠金带回家!365天免费使用,让你轻松入门深度学习!是...

32810
来自专栏Petrichor的专栏

git: 添加表情包 提升 github仓库 逼格

1072
来自专栏张戈的专栏

再次扩散:Linux系统bash漏洞CVE-2014-6271仍未被彻底修复,红帽再发补丁

昨天发文扩散这次 Linux 严重漏洞的检测和修复方法。 今天上午,RedHat 官网再发新补丁: ? 详见:https://rhn.redhat.com/er...

33910
来自专栏Youngxj

烧脑之作impress js幻灯片

1204
来自专栏向治洪

maven配置详解

什么是pom?     pom作为项目对象模型。通过xml表示maven项目,使用pom.xml来实现。主要描述了项目:包括配置文件;开发者需要遵循的规则,缺...

1905
来自专栏帮你学MatLab

期刊要求图片eps格式的输出

期刊图片 部分版本在生成eps文件是会报错,才发现原来这个工具升级了,这是新的下载地址:http://www.mathworks.com/matlabcen...

3186
来自专栏前端黑板报

如何正确的提问?

https://github.com/ryanhanwu/How-To-Ask-Questions-The-Smart-Way指向 Github 的一个仓库:《...

932
来自专栏Python小屋

Python批量生成垃圾邮件内容

问题背景:这个文章的代码是为下一篇关于贝叶斯分类的文章做准备的,用来生成一些模拟的垃圾邮件。一般而言,垃圾邮件都是带有特定目的的,所以邮件中必然会包含一些特定的...

3386

扫码关注云+社区