数据可视化分析

从问题说起

1、你的可视化有何目标

用户是谁?

有什么问题需要解决?

2、选择哪些内容来实现这一目标

如何解答他们的问题?

又发现哪些问题?

用户查看内容后会获得哪些信息

选择正确的可视化类型

1.时间趋势

最适合显示时间趋势的可视化视图是折线图、分区图和条形图。另外,应尽量在 X 轴输入时间,在 Y 轴输入度量。

2.比较和排序

另一种分析数据的方法是进行比较和排序。我们根据一个或一组条件对国家、地区、业务部门、销售人员和运动员进行比较和排序。在许多情况下,这样的分析能够帮助我们认清自己所处的位置和表现。条形图非常适合比较和排序,因为它可以基于相同的基线将数量值显示为长度,使值的比较变得简单。

3.相关性

进行简单的相关分析即可识别度量之间的关系。但相关性并不能保证存在关系。它只是表示可能存在关系。若要确认确实存在关系,通常需要使用更为复杂的方法。比较适合解决这一问题的是散点图和气泡图。经验法则是将最重要 的数据在 X 轴或 Y 轴 上显示,较不重要的 数据在颜色、大小和 形状上显示。

4.分布

分布分析在数据分析中尤为有用,因为它可以显示您的定量值在全部定量范围中呈现 何种分布形式。例如,医院可能想了解患者治疗持续时间的分布情况。那么医院应该 使用哪种图表呢?他们其实有几个选项可以选择。两种最常 用的图表实现此目的,一个是箱型图,另一个是堆叠图。

如果一个数据集中包含了一个分类变量和一个或者多个连续变量,那么你可能会想知道连续变量会如何随着分类变量水平的变化而变化,而箱形图就可以提供这种方法,它只用了5个数字对分布进行概括,即一组数据的最大值、最小值、中位数、下四分位数及上四分位数。

堆叠柱状图可以形象得展示一个大分类包含的每个小分类的数据,以及各个小分类的占比,显示的是单个项目与整体之间的关系。

5.局部到整体

可能在有些情况下想进行部分到整体的分析。虽然这种情况下最常用的是饼图, 但是我们建议避免使用饼图,理由有两个:1) 人类的视觉系统并不擅长估算面积;2)只能对相邻的部分进行比较。这种分析比较建议使用百分比堆叠柱状图,用于形象的展示一个大分类包含的每个小分类的数据,以及各个小分类的占比,显示的是单个项目与整体之间的关系。

几条准则:

1、有效地使用颜色和形状有助于更轻松地查看和理解模式。不过,如果一个视图中包 含过多的颜色和形状,则会适得其反。一个视图中最多使用 7-10 个颜色和形状,才便于区分和了解重要模式。

2、将最重要的视图放在仪表板的顶部或左上方。在查看仪表板时,一般是先看到 中间部分。

3、如果您的可视化视图已经做好交互式链接(即第一个视图筛选下一个视图, 后者又筛选下下个视图,以此类推),则按照从上到下和从左到右的结构排列。

4、除非确实有必要增加数量,否则应将仪表板的视图限制为三或四个。如果添加 的视图太多,详细信息中可能不会显示大图。可以用多个仪表 板来讲述一种情况的来龙去脉。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181025G0Q1PE00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

同媒体快讯

扫码关注云+社区

领取腾讯云代金券