Python数据分析之简书七日热门数据分析七日热门的文章发布日期排名

之前爬了一些数据,没有做分析,今天在练习jupyter notebook的使用,干脆拿了2月七号爬取的七日热门数据来进行简单的分析,主要运用了mongodb的pipeline管道等技术加上charts包的使用。

七日热门的文章发布日期

第一次看了下效果,感觉是标题党(说好的七日热门呢),可能是因为有些文章太好,以至于一直存留吧,然后对超过七天的文章进行剔除。

每天的收录数量都很平均,2月6号偏少的原因可能是来不及统计(我是2月7号爬虫)。再看看发布的具体时间:

文章大数为下午,晚上所写。大部分为上班原因。(其实很佩服那些白天上班,晚上还给大家分析学习的人)。

排名

先看看热评文章的作者:

以此类推,也可以分析出打赏最多等统计数据。最后看看综合排名最高的文章(评论,浏览,打赏和喜欢):

最后一击!2016年Mac 系列里我认为最值得推荐软件 学霸的笔记,教育的失败? 春节这几天,我看的7部电影 曾经有人和我道晚安 春晚小品不好笑我可以忍,但大过年出来恶心人就不对了 简年14:暗恋真的是一个人的事吗? 非功利性英语学习工具推荐(iOS版本) 三分钟即席演讲与月入10W+,这才是你要学会的本领 我是如何从土肥圆逆袭成为白富美的? 嫁给穷男人不幸福?我就是那个坐在自行车上笑的女人

看来大家都喜欢看一些舒缓的文章(我已哭晕在厕所)。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏牛客网

我的校招总结

写在前面的话 经过找实习、经历校招这半年的努力,应届小硕也是找到了自己满意的工作。作为非Compute Science专业,没有ACM大赛经验,也没有特别牛逼的...

4507
来自专栏新智元

【快报】机器学习识别自杀行为准确率达到93% | 赛灵思推出FPGA加速堆栈方案,比CPU快40倍

1 赛灵思推出FPGA加速堆栈方案,比CPU快40倍,比其它FPGA方案快6倍 ? 赛灵思公司(Xilinx)近日在2016全球超算大会(SC 16))上宣布推...

2795
来自专栏大数据文摘

Cell文章:肠道微生物及个人饮食定制算法

25317
来自专栏微信公众号:Java团长

Java架构师之路:Java程序员必看的15本书的电子版下载地址

  作为Java程序员来说,最痛苦的事情莫过于可以选择的范围太广,可以读的书太多,往往容易无所适从。我想就我自己读过的技术书籍中挑选出来一些,按照学习的先后顺序...

991
来自专栏钱塘大数据

麻省理工发明“读心机”,,除了自己,全世界它最懂你

在英剧《神探夏洛克》中,主角福尔摩斯总是能根据对方的言谈举止、穿着打扮准确分析出对方的所思所想,仿佛拥有了“读心术”,能轻而易举地进入对方的内心世界。

884
来自专栏BestSDK

这10件事情都忍不了,就别和程序员谈恋爱了

1、他们智商虽高,但却恼人 如果不是聪明人,则不能够胜任做他们的女朋友,因为跟不上运行在他们脑中和笔记本电脑屏幕上的所有东西。在程序员和同事谈话的时候,你往往觉...

3159
来自专栏机器人网

快了10万倍!DNA纳米机器人技术背后的原理?

据外媒报道,慕尼黑工业大学(TUM)的科学家基于分子研发出一种DNA纳米机器人(具体来说,就是一只机械臂),当技术发展成熟后,它就可以被用于完成“即时任务”。 ...

2687
来自专栏机器之心

Nature:刚入校门的PhD们还可以抢救一下

1. 找到适合自己的节奏,保持健康的工作-生活平衡。读博期间始终维持这种平衡、保持平稳的工作状态可比过度工作然后崩溃好多了。好的身体是成功的关键。

642
来自专栏编程坑太多

计算机或许已经烂大街了,女生学计算机没出路吗?

1462
来自专栏新智元

新科图灵奖得主、体系结构宗师David Patterson亲述开挂的人生

【导读】ACM刚刚公布了2018年的图灵奖得主,计算机体系结构大师John Hennessy和David Patterson两人共同获得此殊荣。ACM的颁奖词这...

3277

扫码关注云+社区