前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >PowerBI中的箱型图(box plot)

PowerBI中的箱型图(box plot)

作者头像
陈学谦
发布2020-06-10 16:20:36
4.9K0
发布2020-06-10 16:20:36
举报
文章被收录于专栏:学谦数据运营学谦数据运营

五数是指:最小值、第一四分位数、中位数、第三四分位数、最大值。

当然,不同的箱型图,指标也不尽然全都一样,比如PowerBI中的一个可视化工具Box Whisker chart就是其中的一种,又叫做盒须图。

所以就用Box Whisker chart来说明。

以下是它的6个指标,比“五数”多了一个平均数。

当然,有一些箱型图并不是按照上面的指标比如下面这张图,它其实没有上下边界,取而代之的是上下1.5个IQR的界限,而有些值超过了上下界限,就定义为异常值(圆圈的位置)。

比如我们选择销售表中的各分公司、销售员和销售额可以得到如下的箱型图:

从中可以看出:

分公司B的最大值远远超过其他分公司,说明这个月的领头羊就出现在B分公司;

而几乎所有的分公司都有新人,销售额为0;

均值>中位数,比较明显的有A/B/F;

均值<中位数,比较明显的只有G;

均值≈中位数,有C/D/E/H/I;

因此,绝大多数分公司平均值大于或等于中位数,而只有G公司比较特殊,平均值明显低于中位数。

对于B分公司来说,平均值与中位数差距很大,说明“贫富差距”很大,有几个销售员的业绩特别好,是整个集团的领头羊,而其他的销售员其实和其他分公司没什么区别。

但是G公司的情况与此相反,中位数比其他分公司都要高,而且其实均值也比较高,说明分公司G整体运营比较好,都属于老员工,最大值也不是很高,说明销售员水平也都比较平均;不过,有少量的员工不知道什么原因,这个月的销售额为0,从而造成平均值偏低的情况。

我们再从时间维度来查看这个分公司G今年各月的情况:

这时候就可以看到,在1-4月份,该分公司的平均值也是大于或等于中位数的,仅仅是在5月才出现异常情况,那么猜测是有两种情况:

①新来了1-2名员工,由于在培训期,业务不熟练,导致本月销售额为0;

②之前销售额正常的销售员,在5月因为某些原因导致销售额很低

经过询问,得知G分公司在5月初有两名女员工开始休产假,而他们在之前的几个月销售额都比较高。当然,本来呢,G分公司就一直有新员工进入,所以几乎每个月都会有销售额为0的员工。

而我们也不得不关注F和I分公司,中位数和均值都靠后,尤其是I分公司,连最大值都只与B分公司的均值差不多,所以确实应该多关注一些。

所以啊,很多企业如果思维还停留在求个均值,甚至连个“人均产能”都算不明白,那么还谈什么企业数字化变革呢?

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-06-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PowerBI生命管理大师学谦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档