R语言实战:评分与销量有相关性吗?

作者:韩琦儿算法工程师,R语言中文社区专栏作者。知乎专栏:https://www.zhihu.com/people/han-qi-er-11/posts

前言

之前有一篇文章分析了价格和评分(好吃程度)的关系,今天来看下吃的人(点评人)越多,是否说明越好吃呢?在这片文章里我们以大众点评上的上海美食数据为例,来分析这个问题。

爬虫数据获取

首先,我随机爬取大众点评上750条上海美食的数据,包括,销量(点评数),人均价格,口味,环境,服务 ,菜系,商区。这里把点评数近似看成销量。

爬取的数据如下:

数据分析

然后,我们来分析得分和销量的关系:

1. 得分和销量的散点图

发现评价和销量的相关性并不强,

进一步对他们做回归分析,

p值为0.02183,说明是有相关性的,回归方程是

score= -3.924e-06 * dp + 9.068

这里回归系数是-3.924e-06 ,几乎就是0 了,令人意外的是截距项值是9.0688,也就是说销量的增长对得分的影响很小很小,但是,销量大于500,得分几乎都是9分多的,

2. 意外发现

海底捞(长寿路店)在所有火锅类得分倒数第一,但点评人数却很高(可能是虚高,应该是有一部分没有写评语的习惯的用户,因为太难吃了,特意写点评发泄,造成点评数虚高)

不难发现上海所有海底捞店的口味确实比服务差很多。

本文来自企鹅号 - R语言中文社区媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【可视化】2014年20大数据可视化工具及资料

PPV课大数据 翻译:数据客(ID: idacker) 如需转载,请与数据客联系授权 巴西的新闻网站Visualoop,这是一家汇集来自互联网的信息图表和数据为...

3339
来自专栏腾讯NEXT学位

腾讯IMWeb前端大会,限时海量福利,错过再等一年!

? IMWebConf 2018 前端大会 10 月 14 日重磅来袭!  汇聚Google、W3C 组织、Adobe、腾讯、阿里、百度、美团、京东等国内外知...

622
来自专栏钱塘大数据

【干货】如何写出一份让人过目不忘的数据分析报告?

导读:大数据时代,各类信息爆炸式增长,如何做出一份好的数据分析报告?一个平庸的标题很可能导致非常出彩的内容被人冷落;而光有吸引人眼球的标题还不够,还需要有吸引人...

3589
来自专栏互联网数据官iCDO

2017年搜索引擎营销局势探秘

译者:李晓艳 本文长度为2158字,预估阅读时间3分钟。 我们今天要向大家揭秘2017年搜索引擎营销局势。 本文是关于搜索引擎营销的使用情况的统计,希望给你...

2176
来自专栏申龙斌的程序人生

一款具有MVP思维的区块链应用

在软件产品开发领域,MVP是一个被经常应用的重要概念,全称为Minimum Viable Product,即最小可行产品。软件开发人员总想做出一款功能大而全的产...

491
来自专栏新智元

【研究院】CHI 2016大会丨人机交互进入手感操作时代

【新智元导读】新智元开通“研究院”专栏,提供各大研究院最新人工智能技术和产业信息,助你掌握业界动态,了解顶级机构研发实例。第一期专栏推荐三星电子中国研究院人机交...

2773
来自专栏VRPinea

8.31 VR扫描:Magic Leap One公布第三方VR应用《RelayCars》;Jaunt转型为To B企业

近日,Magic Leap One公布了VR汽车应用《RelayCars》,这也是第一款兼容MagicLeap One的第三方应用。《RelayCars》允许用...

612
来自专栏ThoughtWorks

软件咨询师工具箱|洞见

软件咨询师对于广大软件工程师来说是一个既向往又神秘的职业。 有人会问:“咨询师要写代码吗?” A:“有可能的啊。” 有人问:“有不写代码的时候吗?” A:“有啊...

3364
来自专栏镁客网

七鑫易维彭凡演讲实录:眼球追踪技术让VR更“人性”

1384
来自专栏理论坞

2018 UI + 交互 流行趋势(案例)汇总

设计趋势往往会受到当今主流媒体,技术的发展,时尚趋势等等影响,设计趋势一般是慢慢形成的,循序渐进的。当然,随着时间的交替也会以同样新旧交替的形式变得落后。201...

982

扫码关注云+社区