可视化图表入门教程

本文转载自永洪科技

iCDO通讯员 | 张雨新

数据可视化,即通过图表形式展现数据,帮助我们快速、准确理解信息。好的可视化会“讲故事”,能向我们揭示数据背后的规律。

本文主要介绍常见图表的信息表达特征和适用场景,帮助大家了解如何在不同的场景下选择合适的图表,从而帮助我们更清晰的传递信息。(注:正文中所有图表的制作所使用的工具为Yonghong Z-Suite)

图1:图表类型

图表基础元素

一张图表至少包含:标题、横纵坐标轴、数据系列、数据标签、图例等部分,每一部分都在图表中扮演特定的角色、表达特定的信息。

图2:图表的基本元素

可视化图表的两个概念

1. 维度(Dimension)

如地区、性别、职业等,常常是观察数据的角度,往往是横坐标。特征为类别型字段、一般是离散的、不可进行四则运算。

2. 度量/指标(Measure)

如UV、PV、客单价、活跃用户数,数据的统计值衡量,往往是纵坐标。特征为数值型字段、一般是连续的、可进行四则运算

可视化图表类型详解

1. 折线图“家族”

折线图作为信息最明了的图表,是各种图表中最容易解读的图表,以下是它的几种变种:

  • 基础折线图

例如图3所表示的是:某公司4.01-5.20日期间新增用户数的变化趋势,其中标记了两个运营的重要事件,分别是“应用市场投放开始”和“应用市场投放停止”。从折线图中我们可以发现,新增用户在应用市场投放后增长明显提升,并且带动了停止投放后的自然新增。

图3:基础折线图

  • 堆积面积图

面积大小对应该类别数值大小,反映不同类别占比关系及其时间趋势变化。

以图4为例,颜色代表不同渠道,面积的大小来表示新增用户,以时间来展示趋势变化。从图4中可看出AppStore和360手机助手为该产品下载量Top1、2的渠道。然而它的缺点是:由色块面积来表示数值大小不够直观。

图4:堆积面积图

2. 柱形图“家族”

  • 累加柱形图

累加柱形图的核心思想是“对比”,适合少量类别的对比,且对比信息特别清晰。

例如图5表示的是某公司在调整运营策略前后的成本对比,经过对比后发现,唤回成本有所提高,拉新成本有所降低。假设该公司的运营策略为侧重唤回,减少拉新,通过这张图就可以发现执行是到位的。

图5:累加柱形图

与堆积面积图相比,堆积面积图比累加柱形图多一时间维度,它可表达时间维度上的趋势变化。

  • 多指标柱形图

主要运用于多个指标进行对比分析的场景,但类别对象不宜过多,当超过5个,不适合使用此图表。

图6是某医院的科室患者和医生人数对比图。从图中可以发现在所有科室中,内科医生为医生数最多的一个科室,而儿科中的患者数是最多的,说明每个医生需要服务到更多的患者。

图6:多指标柱形图

  • 单一指标柱形图

单一指标柱形图,必须按照数值大小降序排列,从而提升条形图的阅读体验。当对比对象类别>5时,将多指标柱形图更改为单指标的条形图,能有效提高数据对比清晰度。

图7:单一指标柱形图

  • 瀑布图

瀑布图的核心是按维度/指标下钻分解,如公司收入各用途分解、公司年利润按分公司分解、业绩按销售团队分解等。

例如图8为某公司去年收入成本的分解,从图中可以看到花费最多的为仓储费用,以此来判断是否有需要降低的费用,从而来提升净利润。

图8:瀑布图

  • 背离式条形图

背离式条形图比单一指标条形图的优势在于:多增加了一个对比维度以及双尾关注(正数第一、倒数第一)。当数据指标有正负对比、前后对比、左右对比概念时候,可以选择背离式柱形图。如:进出口贸易值对比、某业务的前后变化对比、人为构建的均值差异等。

图9:背离式条形图

  • 柱形图结合折线图

柱形图结合折线图,通过对比多个指标,使得一个图表可以表现两个层次的信息。

图10:柱形图结合折线图

3. 散点图“家族”

散点图适合用于发现变量间的关系与规律。

  • 基础散点图

用于观察两个指标的关系。

图11:基础散点图

  • 气泡图

在基础散点图上添加一个指标:用气泡大小来表示。

例如图12中,气泡大小表示在职时间。从图中可以看出,当人均接待数>7的时候,在职时间长的员工2分钟内的回复率较高。

图12:气泡图

  • 基于散点图的分类矩阵

在基础散点图上添加一个维度:用颜色来区分。

例如图13中的科室是我们要观察的维度,如果公司要重点运营某些科室,可能会选择右上角区域内的科室。

图13:基于散点图的分类矩阵

根据散点图的分类矩阵,可以实现分类运营。分类运营是精准运营的开始,比如常见的活跃/不活跃/平民客户/高端客户等用户分类指标。

4. 饼图“家族”

  • 基础饼图

例如图14中,面积代表占比大小。饼图需要标注具体数值,如果没有具体数值的标注,是很难看出分公司D和分公司E占比大小差异的。

图14:基础饼图

技巧:将需要突出显示的部分,置于左上角、顺时针方向。

  • 环状图

环状图是由两个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形,与饼图本质上没有任何差别。

图15:环状图

饼图小结:

1)一般来说,数值最大的部分排在最前面,也就是12点钟方向顺时针;

2)饼图的细分项不宜过多,一般不超过8项;

3)不要制作三维的饼图,不直观;

4)切忌将饼图拉得过开,若要突出某一块,可单独将其拉开。

5. 其他图表

  • 雷达图

雷达图可以直观地呈现几个观察对象在多个指标上对比情况,但需要保证雷达图的指标代表正负倾向一致。需要注意的是:雷达图的线条不超过5条,衡量指标不要超过8个。

例如图16中可以看出,最优秀的为客服A,客服B的主要问题在于质检得分低,客服C的比较平庸,客服D的评估、比例的值很好,但是绝对值不高,他可能为一个很值得培养的新员工。

图16:雷达图

  • 漏斗图

漏斗图适用于关键业务环节数据比较,将各环节串联起来构成漏斗,量化流程内环节,追踪各环节转化率。

图17:漏斗图

  • 地理图

地理图是将数据信息在地理区域上的分解,是空间分布的一个良好展示。

例如图18为某公司平台用户在全国省份的分布情况,颜色越深代表该省份用户越多。

图18:地理图

  • 箱线图

箱线图又称盒须图,是一种显示数据分布情况的统计图,从中可以观察到数据的分布是否密集、是否具有偏向性、是否存在异常值。

图19:箱线图

  • 词云图

词云图是为了描述事物的主要特征,要求能够让人一眼看出一个事物的主要特征,越明显的特征越要突出显示。

例如图20中,Word直接展示对象,Word字体大小表示某种度度量。字体越大,表示出现次数越多。

图20:词云图

  • 树形图

树形图主要用于可视化层次和整体与部分的关系。以区块表示部分与层级,不同区块用颜色区分,用矩形面积表示大小关系。

图21为某家公司用户访问APP中广告位访问的用户访问量的对比,从中我们可以发现,做了UTD活动的访问量是最大的。

图21:树形图

原文发布于微信公众号 - 互联网数据官(internetcdo)

原文发表时间:2018-04-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能

深度学习2017成果展

来源:Statsbot 编译:Bing 编者按:圣诞节前夕,数据公司Statsbot对过去一年(也许更久)深度学习领域的成果做了总结,全文共分为6部分,分别是文...

1905
来自专栏大数据文摘

Facebook人工智能实验室负责人讲深度学习

2166
来自专栏机器之心

百度NLP | Familia:开源的中文主题模型应用工具包

4036
来自专栏AI科技大本营的专栏

盘点深度学习一年来在文本、语音和视觉等方向的进展,看强化学习如何无往而不利

【AI科技大本营导读】AlphaZero自学成才,机器人Atlas苦练后空翻……2017年,人工智能所取得的新进展真是让人应接不暇。而所有的这些进展,都离不开深...

3675
来自专栏机器之心

专栏 | 清华大学刘知远:在深度学习时代用HowNet搞事情

39010
来自专栏机器之心

入门 | 学完了在线课程?如何开启深度学习论文的阅读模式

在一个 Quora 问答《I want to pursue machine learning as a career but not sure if I am ...

951
来自专栏机器之心

前沿 | 手机运行神经网络,MIT新方法使神经网络能耗降低 73%

选自MIT News 机器之心编译 参与:Smith、路雪 麻省理工的研究人员已经设计出了一种新型的精简神经网络的方法。此方法通过给神经网络的能耗进行建模的方式...

2635
来自专栏数据派THU

独家 | 一文读懂语音识别(附学习资源)

一、前言 6月27日,美国权威科技杂志《MIT科技评论》公布2017全球最聪明50家公司榜单。科大讯飞名列中国第一、全球第六。全世界排在科大讯飞前面企业分别是:...

5855
来自专栏机器之心

从Pix2Code到CycleGAN:2017年深度学习重大研究进展全解读

41512
来自专栏AI科技大本营的专栏

ICML进行时 | 一文看尽获奖论文及Google、Facebook、微软、腾讯的最新科研成果

【导读】 ICML ( International Conference on Machine Learning),国际机器学习大会如今已发展为由国际机器学习学...

1114

扫码关注云+社区

领取腾讯云代金券