首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

钉钉在线求饶?五星分期付款?爬取钉钉App Store真实评价数据并分析

一、前言

最近钉钉火了,因为疫情影响,钉钉被教育部选为给学生用来在线上网课的平台,本以为自己因为业务过硬得到官方的认可,是2020上天选中的宠鹅,万万没想到到由于小学生不爽被占用寒假时间上课,于是集体出征在各大应用商店给钉钉打低分

于是就出现了前几天的“钉钉十一亿下载量,整体评分只有一星”,真是好惨一软件。那么就跟随本文一起通过爬取钉钉在App Store的评分,看看用户的真实反应吧。

二、数据爬取

我们的目标就是从App Store官网拿下这些评论数据做分析

本来以为要写个爬虫在用正则表达式去提取,结果一搜发现有现成的App Store评论API

只要将钉钉的id添加进去就OK,这就很简单了,连F12都不用

于是我们很轻松的就得到了钉钉在App Store的评论API

打开看看,OK就是这个,但是比较可惜的是App Store并没有提供评论时间,所以对我们有用的数据就只有用户评分、评论标题、评论内容。

注意到这仅仅是第一页的评论,而通过测试发现最多可以查看10页的评论,所以写一个简单的循环把我们需要的信息提取出来,具体代码

最终爬取的数据长这样

三、数据分析

我们首先看下这500条评分的分值分布

从图中可以看出一共500次评分,1分和5分占了490次,其中打一分的250人,5分的240人,而2分、3分、4分的人数则分别为1、3、6人。看来打分的各位还真是爱憎分明。

接着我们再从title和content中提取与学生相关的文字并统计

看来不管是不是评论者是不是小学生,都喜欢在评论里面聊小学生。

我们再统计一下标题和内容中出现最多的一些关键词。可以用pandas里面的.str.contains()方法

再可视化一下

可以看到,给好评的人和给一星的人旗鼓相当,有骂钉钉吵着下架的,也有鼓励钉钉喊着加油的。但是唯一值得关注的是,有不少人想分期消费

好了,最后我们来制作下词云图,上面的可视化主要利用pyecharts,具体在我之前文章中有详细说明。而词云图的制作选择了python里的wordcloud库,具体使用方法就不细说,看代码

从标题生成的词云图来看,依旧是褒贬掺半

下面是由内容生成的词云图

四、结束语

以上就是本文的全部内容,笔者也是使用钉钉进行办公。而对于钉钉这波哭笑不得的热搜,我想钉钉官方鬼畜已经给出了答案

点个在看在走哦

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200220A0NC5G00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券