大家好,欢迎来到 Crossin的编程教室 !
早上打开微博,早饭都还没吃,就被塞了一个大瓜!
熟练找到了瓜文出处,基本情况就是王力宏前妻忍无可忍,于是发文手撕 ... 博文如下:
开始,我还有些疑惑,前两天王力宏是承认了离婚并发了博文的:
文中透漏的完全是一副好聚好散、岁月静好的气氛,好像用词有点不当了,不过也不纠结这些了。
本人虽不追星,对各种大小明星也基本无感,但王力宏不可能不知道,毕竟很多年前就在娃哈哈的矿泉水瓶上认识了,后来还上过春晚。
王力宏一直是以优质偶像的形象示人。不久之前,娃哈哈终止了与他20年的代言合约,当时网络上还是一片声讨。现在看来,简直就是神预言……
于是我带着吃瓜群众的好奇心读了李靓蕾的微博撕文,哇靠,如果这都是真的,不,只要有一半是真的,那真是欠力宏一座奥斯卡 ...
如此瓜文,怎么能放过评论区呢 ... 于是我准备用 Python 爬取评论区数据,主要代码实现如下:
爬取分析过程这里就不赘述,大家可以看代码。
数据有了,现在我们再用 Python 来看一下 TOP10 词汇有哪些,主要代码实现如下:
看一下效果:
最多的还是给李靓蕾加油鼓劲。另外,孩子也是大家比较关注的焦点。
接着再生成词云看看,主要代码实现如下:
输出效果:
除了前面的热词之外,李云迪也是被大家广泛提及的一个词
领取专属 10元无门槛券
私享最新 技术干货