Destiny,某物流公司数据产品经理,目前从事数据平台搭建和可视化相关的工作。持续学习中,期望与大家多多交流数据相关的技术和实际应用,共同成长。
在之前分享的【数据图表的选择】三篇文章中,已经把不同类型数据图表的用法和适用场景做了一遍梳理。但是,在实际的业务场景中,如何根据拥有的数据集、想要展现的数据模式,去选择最合适的图表,需要不断的去实践和总结。
因此,今天这篇文章分享的内容,是来对比常见相似图表的差别和适用的数据集。
本篇将通过一些来源于实际业务场景的数据集实例,来进行不同的可视化方案对比,从而总结出根据可视化目的、数据集特征,去选择图表类型的一般套路。图表对比部分,会选择一些常见的,且比较容易混淆的图表类型来做对比,以「可视化目标→数据集准备→图表选择和对比→经验总结」的方式来行文。
展示2019年上半年`销售额Top10的手机品牌`、`销售额Top10的手机型号`。
手机品牌 | 销售额(元) |
---|---|
Apple | 1,900,000,000 |
…… | …… |
魅族 | 400,000,000 |
手机型号 | 销售额(元) |
---|---|
Ipnone X 64G 黑色 | 120,600,000 |
…… | …… |
魅族 16th Plus 8GB+128GB 远山白 | 46,500,000 |
数据集1:
价格区间 | 订单数 |
---|---|
[0,10) | 10 |
[10,50) | 27 |
[50,100) | 43 |
[100,+∞) | 6 |
数据集2:
价格区间 | 在售商品数量 |
---|---|
[0,10) | 13 |
[10,20) | 16 |
[20,30) | 16 |
[30,40) | 25 |
[40,50) | 11 |
[50,60) | 14 |
[60,70) | 9 |
[70,80) | 7 |
[80,90) | 6 |
[90,100) | 3 |
数据集1:票房收入(元)
月份 | 国产片 | 外语片 |
---|---|---|
1月 | 800,000,000 | 900,000,000 |
…… | …… | |
6月 | 1,700,000,000 | 800,000,000 |
数据集1:票房收入占比
月份 | 国产片 | 外语片 |
---|---|---|
1月 | 49% | 51% |
…… | …… | |
6月 | 70% | 30% |
数据集1:全国承运包裹量
月份 | 销售额(元) |
---|---|
1月 | 300,000,000 |
…… | …… |
6月 | 430,000,000 |
数据集2:中通、圆通、申通三家快递公司的承运包裹量
月份 | 中通 | 圆通 | 申通 |
---|---|---|---|
1月 | 30,000,000 | 24,000,000 | 26,000,000 |
…… | |||
6月 | 34,000,000 | 25,000,000 | 30,000,000 |
数据集3:全国及主流快递公司的承运量趋势
月份 | 顺丰 | 三通一达 | EMS | 其他快递 |
---|---|---|---|---|
1月 | 32,000,000 | 50,000,000 | 10,000,000 | 8,000,000 |
…… | ||||
6月 | 35,000,000 | 49,000,000 | 11,000,000 | 5,000,000 |
数据集4:主流快递公司的承运量占全国总承运量的趋势
月份 | 顺丰 | 三通一达 | EMS | 其他快递 |
---|---|---|---|---|
1月 | 32% | 50% | 10% | 8% |
…… | ||||
6月 | 35% | 49% | 11% | 5% |
说明:假设集团有且只有这三项业务,且总收入=电商业务收入+物流业务收入+云计算业务收入。
数据集1:总收入构成
年份 | 第一产业 | 第二产业 | 第三产业 |
---|---|---|---|
2015年 | 60,000,000 | 30,000,000 | 10,000,000 |
…… | …… | ||
2019年 | 100,000,000 | 60,000,000 | 40,000,000 |
数据集2:总收入贡献占比
年份 | 电商 | 物流 | 云计算 |
---|---|---|---|
2015年 | 60% | 30% | 10% |
…… | …… | ||
2019年 | 50% | 30% | 20% |
数据集1:三大产业产值单位为【元】
年份 | 第一产业 | 第二产业 | 第三产业 |
---|---|---|---|
2013年 | 3,000,000 | 1,000,000 | 6,000,000 |
…… | …… | ||
2019年 | 5,000,000 | 2,000,000 | 10,000,000 |
数据集2:出货量单位为【部】
手机品牌 | 亚洲 | 欧洲 | 非洲 | 美洲 | 销售额(元) |
---|---|---|---|---|---|
Ipnone X 64G 黑色 | 130,000 | 90,000 | 50,000 | 40,000 | 20,000 |
…… | …… | ||||
小米 | 60,000 | 20,000 | 40,000 | 20,000 | 10,000 |
数据集1:
手机型号 | 售价(元) | 成本(元) |
---|---|---|
HUAWEI P30 | 3688 | 1400 |
HUAWEI P30 Pro | 4988 | 1600 |
HUAWEI Mate 20 | 3199 | 1200 |
HUAWEI Mate 20 Pro | 5099 | 2000 |
…… | …… | |
HUAWEI nova 5 | 2799 | 1000 |
数据集2:
手机型号 | 售价(元) | 成本(元) | 销量(部) |
---|---|---|---|
HUAWEI P30 | 3688 | 1400 | 1,000,000 |
…… | …… | ||
HUAWEI nova 5 | 2799 | 1000 | 200,000 |
(x,y)
的分布,侧重于研究二维数据的两个变量x,y之间的相关性,如身高和体重之间的相关关系。
散点图中,还可以展示多组数据系列的对比,比如男性身高体重和女性身高体重分布规律的对照。抽样
显示,通常采用分层抽样的方法进行,但是分层抽样的依据和影响因素需要依据具体的业务场景而定。不知不觉发现写的内容有点多?,为了方便大家更快的获取信息,将图表对比部分进行了精简,参考如下:
赘述一句:可视化之前,最重要的是弄清楚可视化的目的是什么,你期望展示或探索数据的什么规律。因为,这不仅决定了应该选择什么类型的图表,如何统计和组装你的数据集,也决定了可视化出来的结果是否能达到你的预期目标。
声明:以上图表数据纯属虚构,图形部分由Excel完成,部分由Sketch绘制。