首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

王力宏爆大瓜?!用Python爬取了评论区,看看吃瓜群众怎么说

大家好,欢迎来到 Crossin的编程教室 !

早上打开微博,早饭都还没吃,就被塞了一个大瓜!

熟练找到了瓜文出处,基本情况就是王力宏前妻忍无可忍,于是发文手撕 ... 博文如下:

开始,我还有些疑惑,前两天王力宏是承认了离婚并发了博文的:

文中透漏的完全是一副好聚好散、岁月静好的气氛,好像用词有点不当了,不过也不纠结这些了。

本人虽不追星,对各种大小明星也基本无感,但王力宏不可能不知道,毕竟很多年前就在娃哈哈的矿泉水瓶上认识了,后来还上过春晚。

王力宏一直是以优质偶像的形象示人。不久之前,娃哈哈终止了与他20年的代言合约,当时网络上还是一片声讨。现在看来,简直就是神预言……

于是我带着吃瓜群众的好奇心读了李靓蕾的微博撕文,哇靠,如果这都是真的,不,只要有一半是真的,那真是欠力宏一座奥斯卡 ...

如此瓜文,怎么能放过评论区呢 ... 于是我准备用 Python 爬取评论区数据,主要代码实现如下:

爬取分析过程这里就不赘述,大家可以看代码。

数据有了,现在我们再用 Python 来看一下 TOP10 词汇有哪些,主要代码实现如下:

看一下效果:

最多的还是给李靓蕾加油鼓劲。另外,孩子也是大家比较关注的焦点。

接着再生成词云看看,主要代码实现如下:

输出效果:

除了前面的热词之外,李云迪也是被大家广泛提及的一个词

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20211219A03WY800?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券