RayData数据可视化系列课程第二讲 ——常见的数据可视化图表类型

根据时间绘制

折线图(Line chart)

这是最基本和最常用的可视化图表之一,它用于展示一个或多个变量随时间的变化。

使用场景:您需要显示变量如何随时间变化。

面积图(Area chart)

折线图的一种变体,面积图在一个时间序列中显示多个值。

使用场景:您需要显示一段时间内多个变量的累积变化。

根据排名绘制

条形图(Bar chart)

类似于折线图,但是用宽度相同的条形的高度或长短来表示数据多少的图形,条形图可以横置或纵置。

使用场景:当您需要比较单个时间段中的多个变量或时间序列中的单个变量时,最好使用条形图。

人口金字塔图(Population pyramid)

人口金字塔是用类似古埃及金字塔的形象描绘人口年龄和性别分布状况的图形。能表明人口现状及其发展类型。

图形的画法是:按男女人口年龄自然顺序自下而上在纵轴左右画成并列的横条柱,各条柱代表各个年龄组。底端标有按一定计算单位或百分比表示的人口数量。

使用场景:需要展示人口情况、人口结构、人口趋势等。

展示部分与整体的关系

饼图(Pie chart)

饼图以二维或三维格式显示每一数值相对于总数值的大小。

何时使用:您希望以百分比为基础看到整体的一部分。

矩形树图(Tree map)

矩形树图是一种以嵌套格式显示分层数据的方法。矩形的大小与每个类别占整体的百分比成正比。

矩形树图由马里兰大学教授Ben Shneiderman于上个世纪90年代提出,起初是为了找到一种有效了解磁盘空间使用情况的方法。矩形树图适合展现具有层级关系的数据,能够直观体现同级之间的比较。一个Tree状结构转化为平面空间矩形的状态,就像一张地图,指引我们发现探索数据背后的故事。

使用场景:当你想比较一个整体的部分并且有许多类别时,这些是最有用的。

表示偏离关系

条形图(Bar chart)(实际与预期)

它们比较给定变量的期望值和实际值。

使用场景:需要比较单个变量的预期值和实际值。

表示相关性

散点图(Scatter plot)

散点图以x轴和y轴构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。

使用场景:您希望看到两个变量之间的相关性。

表示频率分布

直方图(Histogram)

又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。它是表示资料变化情况的一种主要工具,用直方图可以解析出资料的规则性,比较直观地看出产品质量特性的分布状态,对于资料分布状况一目了然,便于判断其总体质量分布情况。

使用场景:要查找给定数据集的频率分布。通过观察图的形状,判断生产过程是否稳定,预测生产过程的质量。

盒图(Box plot)

盒图是在1977年由美国的统计学家约翰·图基(John Tukey)发明的。它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值(max)。也可以往盒图里面加入平均值(mean)。如下图,下四分位数、中位数、上四分位数组成一个“带有隔间的盒子”。上四分位数到最大值之间建立一条延伸线,这个延伸线成为“胡须(whisker)”。

由于现实数据中总是存在各式各样地“脏数据”,也成为“离群点”,于是为了不因这些少数的离群数据导致整体特征的偏移,将这些离群点单独汇出,而盒图中的胡须的两级修改成最小观测值与最大观测值。

使用场景:要查看一个或多个数据集的分布。当需要最小化空间时,使用这些来代替直方图直观地识别数据集中的异常值。

表示变量比较

气泡图(Bubble chart)

可用于展示三个变量之间的关系。它与散点图类似,但由于每个气泡的大小和/或颜色表示其他数据,因此添加了更多功能。绘制时将一个变量放在横轴,另一个变量放在纵轴,而第三个变量则用气泡的大小来表示。

使用场景:当您有三个变量要比较时。

热图(Heat map)

热图是数据的图形表示,其中每个单独的值都包含在一个矩阵中。阴影表示由图例定义的数量。

何时使用:当您希望分析数据矩阵中的变量(如天和小时的时间范围)时,这些功能非常有用。不同的色调可以让你快速辨别出极端。下面的示例按小时和一周内的时间显示网站的用户。

表示地理比较

地图热力图(Chloropleth)

choropleth是热力图的一种变体,在一般的业务数据分析中,地图与相关数据的结合,便形成了一种不同于地图的热力图,用于观察相关业务数据的地区分布。

使用场景:需要按地理区域比较数据集。

表示流动性

桑基图(Sankey diagram)

桑基图即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图”。

使用场景:您需要可视化一个数量的流。下面的例子是拿破仑军队在寒冷的冬天入侵俄罗斯时的一个著名例子。军队开始时规模很大,但随着向莫斯科撤退而逐渐缩小。

网络图(Network diagram)

展示实体之间的复杂关系,它显示了每个实体如何连接到其他实体以形成网络。

使用场景:您需要比较网络中的关系。这对于大型网络尤其有用。以下显示了西南航空公司的航线网络。

写在最后,近年来可视化图表样式越来越多,今天的文章仅向大家介绍一些基础的和最常见的图表类型。各种图表的具体使用场景大家可以通过RayData产品进行体验创建。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券