首先看看豆瓣影评:128912条评论,还挺多。
然后我们用python写下如下代码,执行:
执行后我们看看抓取出来的结果:
从爬去后的结果,我们直接做词云分析,执行以下代码:
输出结果,截图呈现给大家:
从结果中,看到有 source icon 等等这些英文单词,所以对于抓取的结果,我们需要清洗,分词(jieba),情感分析。这样才会得到精准的豆瓣评论结果。
今天给大家先实战爬虫,词云两部分。后续清洗,分词再继续更新给大家。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货