R语言实战:评分与销量有相关性吗?

作者:韩琦儿算法工程师,R语言中文社区专栏作者。知乎专栏:https://www.zhihu.com/people/han-qi-er-11/posts

前言

之前有一篇文章分析了价格和评分(好吃程度)的关系,今天来看下吃的人(点评人)越多,是否说明越好吃呢?在这片文章里我们以大众点评上的上海美食数据为例,来分析这个问题。

爬虫数据获取

首先,我随机爬取大众点评上750条上海美食的数据,包括,销量(点评数),人均价格,口味,环境,服务 ,菜系,商区。这里把点评数近似看成销量。

爬取的数据如下:

数据分析

然后,我们来分析得分和销量的关系:

1. 得分和销量的散点图

发现评价和销量的相关性并不强,

进一步对他们做回归分析,

p值为0.02183,说明是有相关性的,回归方程是

score= -3.924e-06 * dp + 9.068

这里回归系数是-3.924e-06 ,几乎就是0 了,令人意外的是截距项值是9.0688,也就是说销量的增长对得分的影响很小很小,但是,销量大于500,得分几乎都是9分多的,

2. 意外发现

海底捞(长寿路店)在所有火锅类得分倒数第一,但点评人数却很高(可能是虚高,应该是有一部分没有写评语的习惯的用户,因为太难吃了,特意写点评发泄,造成点评数虚高)

不难发现上海所有海底捞店的口味确实比服务差很多。

小结

销量的增长对得分的影响很小,但是销量大,是可以得出评分高

不推荐去海底捞吃火锅

PS:本吃货也吃过上海不少火锅店,像小辉哥,小三宝,巴实重庆火锅(真心辣),潮汕牛肉火锅,个人觉得海底捞口味真心一般,那种过于热情的服务我也不喜欢。

回复RR语言快速入门免费视频

回复统计统计方法及其在R中的实现

回复用户画像民生银行客户画像搭建与应用

回复大数据大数据系列免费视频教程

回复可视化利用R语言做数据可视化

回复数据挖掘数据挖掘算法原理解释与应用

回复机器学习R&Python机器学习入门

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20171209G090PX00?refer=cp_1026

相关快讯

扫码关注云+社区