你离餐饮界最懂顾客的老板,只差一个爬虫的距离

在线点评已经成为现代大众消费里的主流行为,我们在外出寻找一家餐馆时,往往会首先去看看吃过的人都如何评价。既然顾客都如此在意点评,饭店老板们就更不用说了。数据侠 John Yap 希望为餐饮老板们设计一个爬虫工具,通过分析用户评价,来让他了解自己的饭店的表现情况,制定相应的运营策略。让我们来看看John Yap 具体是怎么做的吧。

在线点评已经成为现代大众消费里的主流行为。以前饭店想要从消费者那里获得反馈,只能靠顾客填写的意见表。而顾客则更多是阅读食评人的文章来决定去哪里吃。但时代已经变了,现在有很多在线点评应用,比如 Yelp ,比如 TripAdvisor。

在这些app上,用户评分是最重要的部分,它是一次用餐体验的集中体现。

往往一次点评里还包含用户对餐厅的好与坏的具体表述,有时候这些点评还会直接给出是否应该前往用餐的建议。这就营造了一种场景,在这里餐厅被直接曝光在公众的评价之下。这种理念其实并不新鲜,只不过以往只属于食评人的权利,如今到了广大群众的手中。而这些app就成了集中收集和展示人们评论的广场。

所以,看到如今的饭店都在积极的塑造自己的媒体形象也就不意外了,尤其是那些连锁品牌,它们将这些评分视为推进业务的手段。我的项目挑选了纽约人民最爱的Shake Shack 汉堡店和加州人民自豪的 In-N-Out 汉堡店的数据。

(图片来源:网络)

在这篇文章里,我希望用网络爬虫获取的在线点评数据来完成两件事:(1)提供一个数据库记录,让饭店们可以用它来改善业绩;(2)创建一个评估和比较商业表现的工具。

在我的 GitHub (DT君注:关注DT数据侠微信公众号,后台回复“点评”即可获取作者 GitHub 链接。)页面可以看到更多的代码。

▍搭建属于你自己的数据库,对 Yelp 点评数据进行系统性分析

Yelp 的评分等级为1星到5星,5星代表最棒。评分越高你的饭店自然就越有可能被顾客选中。

Yelp 显示评论时候会有一个“ Yelp 、精选”的排序,但具体排序规则外界并不清楚。你自己也可以按照日期或评分升降序来排列,但我觉得有系统地来做这件事情会更好。比如,你可以像我一样,用 Beautiful Soup 来爬取数据,用 Ploty、Excel等软件或者R语言来进行分析。

把每个饭店的平均得分展示出来是个不错的选择,但是这并不能展现这家饭店的真实表现。比如,当一家饭店过往一直得到好评,但最近一周差评增多,这时候如果还是展示平均分数,那很可能它的分数还很高,但真实的趋势其实并不乐观。饭店经理需要知道真实的情况并做出改变。所以,最好在分析评分时候考虑进时间因素:

这组数据来自德州 Plano的 In-N-Out 汉堡店,基于这些数据,饭店经理就可以:对评分变化的趋势进行可视化的分析。这样你就可以知道最近是否评分变差。

分析那些具体的事件。你可以选择只关注某一特定条件的评分变化情况。比如可以只看1星、2星评分,你还可以查看这些评论的具体内容。这样你就可以对比分析,比如,是否在那些人手不足的日子里,饭店获得的评分也会相应变低。

拥有了自己的 Yelp 数据库,你就可以建立一个用于提高表现的参考记录库。比如你可以设置新的栏目,总结评论中吐槽的各类环节,比如后勤、食物或者服务等。这样你就可以发现顾客的抱怨来自哪些环节,并作出针对性的改进。而且,你还可以记录下投诉发生的时间和过程,这样也方便之后的新经理立刻了解过去的经验,避免重复犯错。

▍Yelp 评分作为一个表现评估工具

如果你是一个关心自己Yelp评分的经理,你要如何知道自己在 Yelp 上究竟有没有提升呢?当你有了爬取的 Yelp 数据时,就很方便了。你可以选择一个日期,然后计算到此日期之前的所有评分的平均值,这就和 Yelp 上显示的当日的评分相同(直到下一个评分打出前)。

同样使用上图中的 In-N-Out 汉堡店数据,我们可以得到一个下面这样的数据图:

看起来,三家店都在最开始经历了差评潮,北达拉斯店最为严重。但它三年后提升了一颗星。而Plano店这么多年来依然是平均分最高的店。

你以为就这些么?当然不是!还有更多。你竞争对手的表现如何?比如Shake Shack 汉堡店:

Shake Shack 汉堡店2016年开进得克萨斯。看起来它一开始并没有经历In-N-Out 汉堡店的遭遇,这是否意味着德州人更喜欢 Shake Shack 汉堡店? 或者说他们很快就适应了这个从东部过来的连锁快餐?

到2018年,所有店的平均得分都差不多,唯独 Plano 的店的得分脱颖而出。也许这家店的经理真的配得上一次加薪晋升奖励。

▍何时适合爬取数据

一旦你拿到了 Yelp 的点评数据,你就需要定期更新数据库。那么究竟应该以怎样的频率来更新呢?我们可以看看In-N-Out 汉堡店的数据。这是Plano的这家店获得的点评数的时间分布图:

图表显示,最近每月平均只有1到3个点评。所以每个季度更新一次是更好的选择。而对于像Shake Shack 汉堡店纽约麦迪逊广场店这样,更大客流量,更多点评数据的店,情况就完全不同了:

这家店是 Shake Shack 汉堡店的旗舰店,开业于2004、05年左右。巧合的是,这也正是 Yelp 开始上线运营的时期。图表显示,最近每个月它都会收到5到15个点评,所以也许每个月做一次数据更新比较合适。值得注意的是,有时候每月的平均点评数异常高,甚至达到上百个。我不知道这是怎么回事,可能对应的是它最受欢迎的时期?但这种情况下,数据库的更新就可以更加频繁,每周一次都可以。

也许对于一些饭店业者来说,Yelp 和其他在线点评数据很讨厌。但其实,你完全可以将它转化成自己改进服务的工具。你可以记录什么时候收到了差评,可以对评价进行定制化处理,找到可以提升的领域,甚至可以以此作为评判标准,制定一个提升服务质量的目标,并用这个工具来进行评判。关键的是,这样做的成本很低,你并不需要耗费太多精力就可以提升改善自己的经营。

注:本文编译自数据博客《How Chain Restaurants Can Use Online Customer Reviews to Improve Their Businesses》。内容仅为作者观点,不代表DT财经立场。文中图片部分来自作者。

作者 | John Yap

题图 | 站酷海洛

▍数据侠门派

John Yap是一名在临床试验以及观察性研究方面有多年工作经验的统计学家。他参加了NYCDSA的课程来提高自己的数据科学能力。他希望用自己的能力来帮助人类提高生活质量。

原文发布于微信公众号 - DT数据侠(DTdatahero)

原文发表时间:2018-08-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据挖掘DT机器学习

数据化管理:从我给阿里巴巴数据分析培训讲起

昨天给阿里巴巴的数据分析团队做了一天【零售业的数据化管理】的分享,讲了传统零售的零售思维、零售诊断和零售规律三个主题。这是我最后一张PPT,也是我最想说的话。...

3895
来自专栏Java学习网

如何成为一名出色的 Java 程序员

如何成为一名出色的 Java 程序员 几个月前,我和的商务合作伙伴 Carl 以及我们的法国课程导师 Xavier 在巴黎的一家餐厅就餐。在谈...

2219
来自专栏企鹅号快讯

2018年有4大科技趋势将会改变生活 你怎么看?

最近,德勤数字现实业务的独立副总裁,畅销书《颠覆自己》的作者杰伊·萨米特(Jay Samit),在《财富》网站发表文章,预测2018年会有4大科技趋势改变世界。...

2209
来自专栏PPV课数据科学社区

【推荐】数据安全是政务大数据开放的核心能力

日前,克强总理主持召开的国务院常务会议通过了《关于促进大数据发展的行动纲要》,将大数据定位为推动创新创业及经济转型升级的战略性资源,明确政务信息及公共数据要互联...

3105
来自专栏FreeBuf

315黑名单之夜,信息安全谁能逃过此劫?

还有几个小时,315晚会就开始了,估计已经有一部分公司做好了预防自己中招的准备,公关团队+舆情监控系统蓄势待发,密切关注着315的一举一动,一旦有“万一”,第一...

3796
来自专栏知晓程序

5 款购物小程序,助你「女王节」剁手一臂之力

1263
来自专栏服务端技术杂谈

Ruby on Rails发明人成为富翁之后,变得怎么样了?

我出生于哥本哈根郊区一个中下阶层的家庭。对丹麦人来说,斯堪地那维亚之外都算是贫穷区域。不过丹麦的社福体系已经尽力让社会公平了。 ? 我是中间那位。穿着家里做的衣...

2875
来自专栏ATYUN订阅号

AiServe开发能像人一样走路的辅助性AI,帮助有视力障碍的人

视力障碍是世界上最常见的疾病之一。估计有2.53亿人患有视力问题,失明影响了3600万人。在繁忙的人行道和城市街道,手杖,引导动物和特别的人行横道更易于导航,但...

1205
来自专栏程序人生

如何发表专利

最近听友数量直线上升,评论越来越多,攒了不少。好几天前有条留言说看了我的linked in上有几个专利,感觉高大上,希望讲讲如何发表专利。我估计这是一个大家也许...

3478
来自专栏程序人生

谈谈如何做研究

今天谈谈我自己做研究的方法 —— 它跟随我多年,且一直在演进和完善中。我虽然没有读过 PhD(希望有生之年能够尝试一下),但我自认为这法子并不算差 —— 至少,...

36011

扫码关注云+社区

领取腾讯云代金券