如何利用Data Analytics快速制作桑基图?

桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图”。

桑基图最明显的特征就是,始末端的分支宽度总和相等,即所有主支宽度的总和应与所有分出去的分支宽度的总和相等,保持能量的平衡。

以下这些都是常见的桑基图,以往生成这样的桑基图可能需要掌握R\Python等数据科学编程工具,现在借助Data Analytics这样的BI工具,只需简单拖拽就能迅速生成。

不知道大家是否有印象,在DataHunter之前的推文中,我们也简单生成过下面的桑基图。

现在桑基图的应用范围已经愈加广泛,除了在工业制图方面,在各种数据新闻中总总能看到它们的身影,相较于普通的桑基图,数据新闻中的桑基图往往定制化痕迹更明显。

例1:温室气体排放“桑基图”

例2:全球互联网流量流程图

桑基图的适用场景?

作为一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小。在互联网领域,桑基图主要用于用户流量等数据可视化分析,一个非常典型的场景是电商分析客户从进入商品详情、加入购物车、下单、付款、收货流程的数据流量。除此之外,桑基图在销售、财务等领域也有应用。

如何快速制作桑基图?

场景还原:某公司销售主管想查看09年-12年之间,销售额与运输方式、销售区域等之间的具体关系。

如果借助散点图,则只能查看相关性却看不出销售额的具体流动;

如果借助双轴图等,则在展现维度上会受到限制;

综合考虑,最终决定使用桑基图来展现销售额与各种维度之间的流动关系。

1、数据准备:将Demo数据通过工作表上传到Data Analytics

2、点击新建看板,然后进入图表编辑页面。拖入2个以上维度和度量到相应位置生成图表。

以下图为例,我们将订单日期、运输方式、区域拖入维度,销售额拖入度量,一个简单的桑基图就生成了,鼠标悬浮到相关位置,还能查看具体数据。

通过此图可以回答之前场景中提出的问题,观察09年-12年之间销售额在省份、运输方式以及销售区域之间的流动关系:

a.火车和大卡承担了这四年中主要的商品运输而且比例相对稳定;

b.华南地区的销售贡献量稳居第一,华北、华东和东北紧随其后;

在此基础上,还能根据需要增加维度,比如下图加入了“订单等级”,可以发现中级的订单贡献了主要的销售额。

也可以配置相关颜色

最后提醒大家,桑基图是特定场景下呈现流量关系与结构对比所使用的,不要因为这种图表很炫酷就乱用哦,数据可视化的要义很重要的一条就是,适当的场景使用合适的图表。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180823A15W4L00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券