我们发现目前已经有两万七千多人参与了评分且打 4 星和 5 星的人数居多,总体评分 8.3,算是一个比较优秀的分数了。...我们爬取的数据项包括:评论用户、评论时间、评论星级、评论内容,爬取的数据我们存储到 csv 文件中,实现代码如下:
def spider():
url = 'https://accounts.douban.com...评论星级
再接着,我们看一下该剧每天用户的评论星级,星级最高为 5 星,一天中如果有多条评论星级数据,我们则取其平均值,代码实现如下:
csv_data = pd.read_csv('data.csv'...(loc='upper right')
plt.show()
看一下效果图:
我们从图中可以看出该剧评论星级大致维持在 4 星以上,说明大部分用户对于该剧的质量是比较认可的,评论星级也基本反映出了用户对于该剧的满意度...'但是', '全片', '一点', '一部', '一个',
'什么', '虽然', '一切', '样子', '一样',
'