【数据分析】EMC杯开放数据比赛 – 金刚队作品

今天为大家带来的优秀作品赏析,是来自交大的“葫芦娃大战变形金刚”队的“小康的吃路历程”。金刚队成员:康世勇、沈家齐、黄鈃灵、焦天翼、吴嘉韵。

饮食特征:

横坐标:日校园卡消费额,纵坐标:人数。

蓝色曲线代表男生,黄色曲线代表男生每日消费均值集中在17~18元,而女生则在14元左右。

左边河流图:

横坐标:时间(早上5点半开始),纵坐标:人流量(由该时刻刷卡数量得到)由深至浅六种颜色分别代表一餐到六餐各个餐厅的人流。

三个最显著的高峰,风别出现在早上7点半,中午11点半和下午5点半,这是相当规律的,和上课时间有非常强的相关性。另外值得注意到是在早上8点半和9点半,以及晚上6点刚过的时候还有一个小小的突起,代表了某个群体的集中性就餐。

这幅河流图只是人流涌入情况的展现,而实时逗留人数的展现则更具有实际意义。我们特地选取了中午10点半开始到1点这个时间段,见右下角黑色背景的图。我们发现人数高峰的时间段大概比刷卡高峰的延迟了10分钟左右;四餐有长达半个小时的高峰期,三餐的高峰期比一餐的高峰期时间晚到10分钟。

左图:横坐标代表每周从周日到周六的晚餐就餐人数变化,右边是通过数据分析得到的人流减少的原因分析。我们可以根据不同的因素,合理推断出在某一天的就餐如数变化,就可以提前做出准备。

左图:横坐标是单笔消费额,纵坐标是一学期的消费人次。通过分析我们得出,中间的高峰表示,单笔消费7~9元是交大人最能接受的金额;而超过15元的消费已经寥寥了,所以可以认为15元是大部分交大人单次消费的极限。

右图:横坐标是某个人在某个商户的一学期消费次数,纵坐标代表有多少个这样的人。曲线呈现出非常明显的幂率分别,我们通过拟合可以到到幂函数,图中为y=358140x-1.617,alpha值为1.617,alpha值越大,曲线衰减越快,所以可以用alpha值来衡量餐厅受欢迎的程度。

图中横坐标代表消费价格,纵坐标代表一学期消费次数。我们把各个餐厅价格-客流曲线都绘出,如上图。

可以从途中归纳出3种类型的餐厅,我们把它们命名为单峰型,多峰型和平缓型。其特征均非常显著,单峰型单点突起,多峰型由多个点构成多个高峰,多个峰往往呈现出缓缓上升,快速下降的趋势。平缓型的由多个点组成的平缓上升下降曲线。

而对应到具体的餐厅类型则是尖峰型属于多种套餐可以选择的,单峰型属于有主打招牌,可供选择并不多。而平缓型的则属于可以自由组合的类型。

为什么同样属于加大第四餐饮大楼二层西面的三家店铺,烧腊饭、粉面饭和笼仔饭的销售情况却有如此大的差异呢。

首先我们比较三者的流量,虽处于相同位置,流量却大不相同,烧腊饭最为吸引顾客,而笼仔饭则排名垫底,另外三者的价格区间并结合图示,我们发现粉面饭很大一部分消费是落在7~9元的,交大人最能接受的价格区间内的,而笼仔饭的价格区间则在9到14元,明显价格偏高。

通过对比三家餐厅的重复购买情况,我们发现笼仔饭alpha值最大,可见其顾客忠诚度较低。如果我们将在消费次数分布的基础上,再做一次统计,分别统计重复购买次数在1、2~3、4~9、10~29、30~150次情况下人数,做出回头客百分比堆积图,我们发现其实笼仔饭的首单客流量并不小,但是留存率极低。所以笼仔饭需要在定价、菜品和口味等地方进行改善。

以上只是一个粗浅的分析框架,希望那个能建立一个尽可能普适的评判框架,可以最各个餐厅的经营情况有准确的评估,进一步可以改善他们的经营状况。

我们设想的开放数据下的校园全景图,如何用数据来发现未知的关联,指导我们的学习生活,改进学校的服务流程。

PPV课其他精彩文章:


1、回复“干货”查看干货 数据分析师完整知识结构

2、回复“答案”查看大数据Hadoop面试笔试题及答案

3、回复“设计”查看这是我见过最逆天的设计,令人惊叹叫绝

4、回复“可视化”查看数据可视化专题-数据可视化案例与工具

5、回复“禅师”查看当禅师遇到一位理科生,后来禅师疯了!!知识无极限

6、回复“啤酒”查看数据挖掘关联注明案例-啤酒喝尿布

7、回复“栋察”查看大数据栋察——大数据时代的历史机遇连载

8、回复“数据咖”查看数据咖——PPV课数据爱好者俱乐部省分会会长招募

9、回复“每日一课”查看【每日一课】手机在线视频集锦

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2015-05-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏镁客网

性能达“怪兽”级别的激光器,以超高发射频率拍摄达原子分辨率照片 | 黑科技

1490
来自专栏量子位

今年的NIPS大会还没开,但五大AI竞赛已在PK中

陈桦 编译整理 量子位 出品 | 公众号 QbitAI ? 如果希望推动创新,那么举办比赛是个好主意。这就是NIPS(神经信息处理系统)大会提出的设想。在今年的...

3736
来自专栏新智元

【Geoffrey Hinton传奇】你我都是机器人

来源:TorontoLife 作者:Katrina Onstad 编译:文强,司明,张乾 【新智元导读】Torontolife以“Mr Robot”为题对Hin...

3619
来自专栏宏伦工作室

SODA-大型活动大规模人群的识别和疏散:从公交2.0到公交3.0

2546
来自专栏大数据文摘

我们文本分析了贾跃亭2017年全部公开信,发现他近期喜欢用“责任”“致歉”

1382
来自专栏AI研习社

机器人:我不是药神,我只医生的小帮手 | ICRA 2018

小编最近看了场悲伤的电影,由程勇“印度仿制药”一案改编而成的电影,《我不是药神》。

1012
来自专栏人工智能头条

当今世界最NB的25位大数据科学家

5404
来自专栏机器人网

罗塞塔探测器与彗星的“第一次亲密接触”

"罗塞塔"彗星探测器于格林尼治时间8月6日9时29分(北京时间17时29分)成功进入环绕"丘留莫夫-格拉西缅科"彗星的轨道,这也标志着欧洲航天局投入多年的彗星探...

3405
来自专栏新智元

IJCAI最佳论文重磅出炉!中国人论文占46%,华人一作近2/3

【新智元导读】IJCAI最佳论文公布!本届会议华人表现依旧抢眼,中国学者获多篇Distinguished Paper奖,中国人论文46%,华人一作论文占总接收论...

1362
来自专栏数据科学与人工智能

【应用】信用评分卡 : 变量选择

下面的故事可以追溯到我开始从物理到商业的转变。我在周五晚上的派对上遇到了这位投资银行家。喝完几品脱啤酒后,他的情绪变得有些阴沉,他告诉我他是如何讨厌他的工作。然...

1235

扫码关注云+社区

领取腾讯云代金券