前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【数据分析】EMC杯开放数据比赛 – 金刚队作品

【数据分析】EMC杯开放数据比赛 – 金刚队作品

作者头像
小莹莹
发布2018-04-23 15:22:56
1K0
发布2018-04-23 15:22:56
举报

今天为大家带来的优秀作品赏析,是来自交大的“葫芦娃大战变形金刚”队的“小康的吃路历程”。金刚队成员:康世勇、沈家齐、黄鈃灵、焦天翼、吴嘉韵。

饮食特征:

横坐标:日校园卡消费额,纵坐标:人数。

蓝色曲线代表男生,黄色曲线代表男生每日消费均值集中在17~18元,而女生则在14元左右。

左边河流图:

横坐标:时间(早上5点半开始),纵坐标:人流量(由该时刻刷卡数量得到)由深至浅六种颜色分别代表一餐到六餐各个餐厅的人流。

三个最显著的高峰,风别出现在早上7点半,中午11点半和下午5点半,这是相当规律的,和上课时间有非常强的相关性。另外值得注意到是在早上8点半和9点半,以及晚上6点刚过的时候还有一个小小的突起,代表了某个群体的集中性就餐。

这幅河流图只是人流涌入情况的展现,而实时逗留人数的展现则更具有实际意义。我们特地选取了中午10点半开始到1点这个时间段,见右下角黑色背景的图。我们发现人数高峰的时间段大概比刷卡高峰的延迟了10分钟左右;四餐有长达半个小时的高峰期,三餐的高峰期比一餐的高峰期时间晚到10分钟。

左图:横坐标代表每周从周日到周六的晚餐就餐人数变化,右边是通过数据分析得到的人流减少的原因分析。我们可以根据不同的因素,合理推断出在某一天的就餐如数变化,就可以提前做出准备。

左图:横坐标是单笔消费额,纵坐标是一学期的消费人次。通过分析我们得出,中间的高峰表示,单笔消费7~9元是交大人最能接受的金额;而超过15元的消费已经寥寥了,所以可以认为15元是大部分交大人单次消费的极限。

右图:横坐标是某个人在某个商户的一学期消费次数,纵坐标代表有多少个这样的人。曲线呈现出非常明显的幂率分别,我们通过拟合可以到到幂函数,图中为y=358140x-1.617,alpha值为1.617,alpha值越大,曲线衰减越快,所以可以用alpha值来衡量餐厅受欢迎的程度。

图中横坐标代表消费价格,纵坐标代表一学期消费次数。我们把各个餐厅价格-客流曲线都绘出,如上图。

可以从途中归纳出3种类型的餐厅,我们把它们命名为单峰型,多峰型和平缓型。其特征均非常显著,单峰型单点突起,多峰型由多个点构成多个高峰,多个峰往往呈现出缓缓上升,快速下降的趋势。平缓型的由多个点组成的平缓上升下降曲线。

而对应到具体的餐厅类型则是尖峰型属于多种套餐可以选择的,单峰型属于有主打招牌,可供选择并不多。而平缓型的则属于可以自由组合的类型。

为什么同样属于加大第四餐饮大楼二层西面的三家店铺,烧腊饭、粉面饭和笼仔饭的销售情况却有如此大的差异呢。

首先我们比较三者的流量,虽处于相同位置,流量却大不相同,烧腊饭最为吸引顾客,而笼仔饭则排名垫底,另外三者的价格区间并结合图示,我们发现粉面饭很大一部分消费是落在7~9元的,交大人最能接受的价格区间内的,而笼仔饭的价格区间则在9到14元,明显价格偏高。

通过对比三家餐厅的重复购买情况,我们发现笼仔饭alpha值最大,可见其顾客忠诚度较低。如果我们将在消费次数分布的基础上,再做一次统计,分别统计重复购买次数在1、2~3、4~9、10~29、30~150次情况下人数,做出回头客百分比堆积图,我们发现其实笼仔饭的首单客流量并不小,但是留存率极低。所以笼仔饭需要在定价、菜品和口味等地方进行改善。

以上只是一个粗浅的分析框架,希望那个能建立一个尽可能普适的评判框架,可以最各个餐厅的经营情况有准确的评估,进一步可以改善他们的经营状况。

我们设想的开放数据下的校园全景图,如何用数据来发现未知的关联,指导我们的学习生活,改进学校的服务流程。

PPV课其他精彩文章:


1、回复“干货”查看干货 数据分析师完整知识结构

2、回复“答案”查看大数据Hadoop面试笔试题及答案

3、回复“设计”查看这是我见过最逆天的设计,令人惊叹叫绝

4、回复“可视化”查看数据可视化专题-数据可视化案例与工具

5、回复“禅师”查看当禅师遇到一位理科生,后来禅师疯了!!知识无极限

6、回复“啤酒”查看数据挖掘关联注明案例-啤酒喝尿布

7、回复“栋察”查看大数据栋察——大数据时代的历史机遇连载

8、回复“数据咖”查看数据咖——PPV课数据爱好者俱乐部省分会会长招募

9、回复“每日一课”查看【每日一课】手机在线视频集锦

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-05-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档