作者:韩琦儿算法工程师,R语言中文社区专栏作者。知乎专栏:https://www.zhihu.com/people/han-qi-er-11/posts
前言
之前有一篇文章分析了价格和评分(好吃程度)的关系,今天来看下吃的人(点评人)越多,是否说明越好吃呢?在这片文章里我们以大众点评上的上海美食数据为例,来分析这个问题。
爬虫数据获取
首先,我随机爬取大众点评上750条上海美食的数据,包括,销量(点评数),人均价格,口味,环境,服务 ,菜系,商区。这里把点评数近似看成销量。
爬取的数据如下:
数据分析
然后,我们来分析得分和销量的关系:
1. 得分和销量的散点图
发现评价和销量的相关性并不强,
进一步对他们做回归分析,
p值为0.02183,说明是有相关性的,回归方程是
score= -3.924e-06 * dp + 9.068
这里回归系数是-3.924e-06 ,几乎就是0 了,令人意外的是截距项值是9.0688,也就是说销量的增长对得分的影响很小很小,但是,销量大于500,得分几乎都是9分多的,
2. 意外发现
海底捞(长寿路店)在所有火锅类得分倒数第一,但点评人数却很高(可能是虚高,应该是有一部分没有写评语的习惯的用户,因为太难吃了,特意写点评发泄,造成点评数虚高)
不难发现上海所有海底捞店的口味确实比服务差很多。
本文来自企鹅号 - R语言中文社区媒体
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文来自企鹅号 - R语言中文社区媒体
如有侵权,请联系 cloudcommunity@tencent.com 删除。