微博榜单爬虫及数据可视化

前言

今天继续APP爬虫,今天爬取的是微博榜单(24小时榜)的数据,采集的字段有:

用户id

用户地区

用户性别

用户粉丝

微博内容

发布时间

转发、评论和点赞量

该文分以下内容:

爬虫代码

用户分析

微博分析

爬虫代码

用户分析

首先对部分用户id进行可视化,字体大一点的是上榜2次的(这次统计中最多上榜的是2次)。

接着对地区进行数据处理,进行统计。可以看出,位于北京的用户是最多的(大V都在北京)。

接下来看下用户的性别比例:男性用户占多。

最后再看看上榜大V粉丝前十:

微博分析

首先,对时间数据进行处理,取出小时时间段。

接着,我们看看微博点赞前十的用户。

最后,绘制微博文章词云图。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180814G1FCAO00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券