专栏首页早起PythonPython分析三个月微博热搜数据带你回顾2020不平凡的90天

Python分析三个月微博热搜数据带你回顾2020不平凡的90天

前言

北京时间4月3日凌晨,全球新冠病毒感染人数突破100万,死亡人数超过5万。而这一切都在2020年刚开始的三个月内发生。可能你觉得这三个月很快,有些事情已经逐渐忘记,而互联网的记忆不会消失,数据也会说话。因此作者抓取了2020年1月1日至4月2日的每天微博排名前50条热搜共近5000条数据,通过分析微博热搜数据带你回顾这不平凡的90天。

Part1

首先我们制作这三个月全部热搜的词云图

可以看到,疫情下的微博热搜主要以疫情相关词汇组成,我们再根据每一条热搜的热度大小进行排序,得到这三个月中热度最高的十条热搜,猜猜是什么

令人惊讶的的是,在这三个月内的每日热度排名前十的热搜中娱乐相关的热搜为4条,疫情相关热搜为5条。并且第一第二的并不是疫情相关热搜,而是两位明星相关的资讯

Part2

我们接着提取中国各省市在热搜中出现的次数,以此来代表网友对各省的关注度绘制关注度地图词云图

从热搜出现的省份来看最受关注的还是湖北省,其次是北京、上海、浙江、四川等省市,从热搜出现的城市来看,武汉、广州、北京、杭州、上海等城市出现次数较多。同时值得关注的是:境外和公主号邮轮也频上热搜。

Part3 疫情来袭

现在我们分析三个月内每天50条热搜中疫情相关热搜数量的变化,

不难看出,在1月19日之前,关于疫情相关的热搜基本保持在5条以下,甚至有几天并未出现相关热搜,但是自1月20日开始,突然暴增20+条,并且最高曾一天有30+条相关热搜,其中最主要集中在1月23至25日,我们再回顾那几天的热搜

可以看到,虽然正值新春佳节,但是全国网友的关注点基本都集中在疫情,在湖北,在武汉。而现在今天这条热搜已经有10亿+的阅读了。当然在这场疫情之下的热搜还有很多值得关注的热搜,比如河南硬核防疫频登热搜、买不到的口罩也曾霸屏微博、封闭式管理虽受吐槽但是颇有成效

Part4 逆行驰援

可能上面的热搜已经从记忆里淡去,但是你必须要记得的热搜应是全国各地医护人员驰援湖北,我们提取相关关键词的热搜并制作词云图?

可以看到,从1月23日也就是我们刚刚分析的疫情热搜暴涨的那几天开始各地医生便逆行驰援武汉;2月1日,李兰娟带队驰援武汉;2月4日,再增加2000名医护人员支援湖北;2月7日,一省包一市支援湖北;2月13日,2月14日,四川、辽宁再派2批医疗队伍驰援湖北;2月20日,重庆调拨20万毫升血浆增援湖北⋯⋯

Part5 乌云散去

正是有着上面一群勇敢逆行的医护人员,加上大家的努力,疫情的乌云渐渐散去,因此三月的热搜主旋律除了防疫还有复工和开学

而说到开学,那就少不了小学生被钉钉支配的恐惧,我们提取相关热搜

再看看学生们的反馈?

Part6

最后我们对近一周的热搜进行分析可以发现,疫情依旧是大家关注热点,但是侧重点已经从国内转向国外,并且无症状感染者已经引起了大家的关注,所以各位依旧要做好防护措施,不能对防疫掉以轻心

:本文所有分析使用的数据均采集于新浪微博公开数据 ,采样时间为每天23点。

本文分享自微信公众号 - 早起Python(zaoqi-python),作者:刘早起早起

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-04-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 想做疫情分析却没有数据?看这篇就够了

    大家好,之前我们已经将疫情可视化的各种操作基本都讲了一遍,从爬取数据到数据分析、建模、可视化甚至有关如何开发疫情实时追踪网站我们都讲了一遍,因此很久没有更新过疫...

    刘早起
  • 什么!Python还能帮你找老婆?

    大家好,今天是周日,来点愉快的。昨天在读书的时候,看到一个案例说美国有一位大哥,为了找到一个合适的女朋友,写了一段代码拿到了婚恋网站的一些妹子数据,然后使用一些...

    刘早起
  • Python+Excel+Word一秒制作百份合同

    今天我们继续分享一个真实的办公自动化需求:如何使Python+Excel+Word批量生成指定格式内容的合同。

    刘早起
  • "清华-腾讯联合实验室"针对疫情的分析9:非湖北地区疫情消退加快,湖北疫情出现转折

    文章内容转自:腾讯医典 2月15日,国家卫健委和各省卫健委公布的数据,有两个特点,非湖北地区的新增病例持续下降;而湖北省内,武汉以外地区治愈人数首次超过新增病...

    腾讯高校合作
  • "清华-腾讯联合实验室"针对疫情的分析21:北京疫情引关注,境外疫情传播加剧

    文章转自:腾讯医典 国家卫健委发布的2月26日的疫情数据,全国(不含港澳台)新增确诊433例,现有确诊43258例,非湖北地区新增确诊病例24例。 目前,非...

    腾讯高校合作
  • "清华-腾讯联合实验室"针对疫情的分析24:武汉新增病例三连升,但疫情即将开始消退

    文章转自:腾讯医典 国家卫健委发布的2月29日的疫情数据,全国(不含港澳台)新增确诊573例,现有确诊35329例,非湖北地区新增确诊病例3例,现有确诊病例数...

    腾讯高校合作
  • 致敬“疫”线Hackers | 腾讯Serverless服务免费支援中

    一次与疫情的时间赛跑,一场一心战一“疫”的公益赛事,一群人历经20天的开源协作,wuhan2020 黑客马拉松圆满落下帷幕。 疫情防控,全民参与 ? 疫情之下...

    腾讯云serverless团队
  • 一文掌握UML类图-PlantUML实操

    UML(Unified Modeling Language,统一建模语言)是一种为面向对象系统的产品进行说明、可视化和编制文档的一种标准语言,是非专利的第三代建...

    唔仄lo咚锵
  • 01 详析一次腾讯一面 | 移动端开发岗

    URL realUrl = new URL(url); HttpURLConnection conn = (Htt...

    凌川江雪
  • 经常被问到的有深度有内涵的数据结构面试题

    数据结构是以某种形式将数据组织在一起的集合,它不仅存储数据,还支持访问和处理数据的操作。Java提供了几个能有效地组织和操作数据的数据结构,这些数据结构...

    分享达人秀

扫码关注云+社区

领取腾讯云代金券