首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

百货数据分析——原来如此的来店消费周期

上一章做了基础清洗和整理数据的工作,但有些人可能会想到,客人的平均来店消费周期、或者我的清洗数据是否能有参考性?实际上前面我已经在数据处理和聚合的过程中清洗了一些数据,那么剩下的分析数据是否具有合理性就是关键。在这之前我已经针对每个客人的每个回店周期进行了标准差分析:

每年龄段平均回店消费周期标准差

第二张图阴影部分显示的是置信区间,在55岁之前,参考点基本都在置信区间内,55岁之后相对离散,当然也并非是主力消费人群,离散型较大。因此该部分的数据是可用的。那么下面就开始展示分析结果~

年客回店消费日次数~年龄段

图怎么看,直接关系到能否得知结果,x轴为年龄层,y轴为年客回店消费日次数,红色线如果是平滑曲线则说明这两个参数是线性有关联的(这很重要,所谓线性关联就是说这两个参考项之间是有逻辑关系的,可以互相推断),绿色为平均线。

上面这一张图,代表着不同年龄段的客人每年会来店消费多少次(日次)。年龄20~50之间都是密集分布的形式,且都在均值和曲线之上,这说明这个区间内的客人来店情况是积极的,平均每年有6~7次来店里消费(平均40~55天一次)

年龄30~55之间,线性曲线(红色)都在均值(绿色)之上,但数据密度已经开始离散,到50岁之后离散型加重,且有明显的线性下降,这说明50岁以上的消费者不仅来店消费次数减少,且不稳定。80岁以上有个离群点,在10以上,可能是由于某个残值产生的差异,因为本身这部分人的消费情况就不稳定,甚至是虚假的。

下方和左侧的四分位图说明主要的参考区间,为箱图中间的部分,年平均来店在5~6.5次之间,年龄段基本参考为30~60之间,当然这是需要根据实际情况进行分解的。

其中女性:

在25岁之间呈离散形式较重,说明其消费层次不稳定;25~30岁之间在均值和回归线附近且密集分布,说明这一部分人群非常稳定。30岁以上趋势基本和总体图表相同,但只到65岁以上才开始离散,这说明女性的消费生命要比男性要强(因为总体是平均的)

其中男性:

男性则呈现了很高的离散型,虽然总体趋势在35岁之前都是相同的,但在40岁以后整体曲线快速下降,年龄越大来店次数越少,且不规则,这说明男性比女性更加没有购买的动力,这可能是从40岁以后开始的。

交易笔数

女性

位于年龄25~60之间的参考点均在线性回归线附近(红色),以及平均线上面(绿色),这一部分人群是绝对的主力人群,其中39~50消费能力最强。四分位参考年龄25~60的女性每年会有7~9笔消费,25以下60岁以上的女性年消费次数相对较低,主要分散在1~8次之间

男性

男性的交易笔数展现了与女性几乎相同的趋势能力,注意看到全部年龄段的参考点均位于线性回归线附近,但50岁以上的离群点比较多,离散型也更强。

很明显的,男性的交易能力没有女性强,而且从45岁左右就呈现了下降趋势,女性则可以一直延续到60岁左右。

年消费-年龄段

女性

男性

女性和男性年消费相比在离散点上的趋势与交易笔数相同,年龄段总消费能力男性比女性强一些,但离散型较强,相比之下女性比男性的消费能力稳定的多,且年龄向后延展,而25岁之前的男性消费比女性要稳定(这可能是男的总给女的买东西吧……哈哈哈哈),25~30男女情况相同,在30岁之后的女性则比男性要稳定很多。

年平均客单价(年龄段)

女性

这幅表很有趣,男性在30岁以前的平均消费是要比女性高的,但是从30岁开始,整体虽然离散型较低,却均处在回归线和平均值之下,这说明45岁之后那些男性的强离散点消费客群很明显的拉动了男性消费习惯,因此在45岁之后的男性消费情况是一个很强的分水岭,购买价差可能会很大(这可能是成功男士和平庸男士的区别)

而女性相对就不一样,60岁之前基本都比较平均,60之后的参考点也比较分散的处在平均线和线性参考线的两侧,虽然有所下降,但始终没有那么明显。

平均回店消费周期(年龄)

平均线和线性曲线的交叉点在42岁左右,20~50岁之间的参考点基本位于回归线附近被在平均线之上,也就是说这个年龄段的客人平均会在每50回店消费一次。

相对于平均值,女性回店消费情况相对非常稳健,回归线和平均线基本是接近的。但在55~60岁之间回店消费间隔会拉大。从此表看女性平均每65天回店消费一次,但相对比较平均。

男性的平均回店消费周期则一如既往呈现离散状态,相比女性来说,男性购买商品的概率不会因为周期而左右太多,虽然40岁之前也较为稳定,但是离散型较强。

回店消费间隔周期与平均消费

红色线是非线性的(或可说是2段性质),因此平均回店周期和平均消费之间并没有过多的线性价值,但就女性来说,平均每65天左右会消费600~1000元不等,可以说女性对于购物是有先天性的概念的。

男性也的线性曲线也是二段性的,但相对离散的多,男人购物的不确定性则表现的很明显,可以在任意时刻回店消费,并消费任意金额,不过平均值较高,主要集中在800元左右。

以上就是基本分析,本人非统计学专业,全凭对工作的直觉和喜爱。有意见和建议请尽管提出,谢谢。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180309G0JJAX00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券