前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言实战:评分与销量有相关性吗?

R语言实战:评分与销量有相关性吗?

作者头像
企鹅号小编
发布2018-01-04 16:16:32
7040
发布2018-01-04 16:16:32
举报
文章被收录于专栏:企鹅号快讯企鹅号快讯

作者:韩琦儿算法工程师,R语言中文社区专栏作者。知乎专栏:https://www.zhihu.com/people/han-qi-er-11/posts

前言

之前有一篇文章分析了价格和评分(好吃程度)的关系,今天来看下吃的人(点评人)越多,是否说明越好吃呢?在这片文章里我们以大众点评上的上海美食数据为例,来分析这个问题。

爬虫数据获取

首先,我随机爬取大众点评上750条上海美食的数据,包括,销量(点评数),人均价格,口味,环境,服务 ,菜系,商区。这里把点评数近似看成销量。

爬取的数据如下:

数据分析

然后,我们来分析得分和销量的关系:

1. 得分和销量的散点图

发现评价和销量的相关性并不强,

进一步对他们做回归分析,

p值为0.02183,说明是有相关性的,回归方程是

score= -3.924e-06 * dp + 9.068

这里回归系数是-3.924e-06 ,几乎就是0 了,令人意外的是截距项值是9.0688,也就是说销量的增长对得分的影响很小很小,但是,销量大于500,得分几乎都是9分多的,

2. 意外发现

海底捞(长寿路店)在所有火锅类得分倒数第一,但点评人数却很高(可能是虚高,应该是有一部分没有写评语的习惯的用户,因为太难吃了,特意写点评发泄,造成点评数虚高)

不难发现上海所有海底捞店的口味确实比服务差很多。

本文来自企鹅号 - R语言中文社区媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - R语言中文社区媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档