遇见大数据可视化 : 图表的视觉系统感知

在上篇两篇文章里《遇见大数据可视化:基础研究》《遇见大数据可视化 :来做一个数据可视化报表》,简单的介绍了下可视化的基础和制作流程。我们也发现将数据进行可视化的好处,可以清晰有效的传达数据信息,以实现“用视觉的方式去思考”。相比数据的公平,视觉的方式会带有一定的引导性。

如上图所示,我们能快速的发现图形上的不同之处。NSF的图形和图像处理小组称之为“可视化感知”,人眼的启动时间至少需要200毫秒,在启动时间内能感知到区别的存在(*见附录) 。上图就是一种简单的预先处理感知实例,目标对象具有视觉属性“圆形”,“长条形”干扰物对象没有(所有非目标对象都被认为是干扰物)。观察者一眼就能知道目标对象是否存在还是不存在。

这种“可视化感知”实际上是运用人眼低层视觉系统(Preattentive Processing)的引发的快速感知特征。能够迅速的引发预设在图形中的潜在目标对象的注意。所以我们在可视化设计中可以运用这一特点,快速的迁移观察者的注意点。

按照Anne Treisman在早期提出特征理论(Feature integration theory人类视觉注意力最有影响力的心理模型之一),我们可以继续去寻找影响【个体特征】的视觉属性点。

通过去预设目标对象和干扰对象的颜色、大小、对比和方向的不同特征属性。观察者也可以快速的通过这种“特征搜索” 迁移注意点。

之所以很快就能找到这些注意点,因为它们跟其干扰项相比,最多只相差了一种视觉元素。比如,红色线条和黑色线条,长线条和短线条。当只有一种视觉元素的时候,我们的视觉系统中的低层视觉系统(Preattentive Processing) 就起作用了,它可以平行处理所有在图中出现的点,然后很快找到特征点。我们再来看下反例

跟上面的例子相比,我们要花相对长的时间找到那个注意点。原因很简单,因为图中使用了两种视觉元素来区分特殊点,颜色和大小,方向和对比。在这种情况下,我们的低层视觉系统(Preattentive Processing)就不行了,视觉系统需要一个一个的处理每个点,识别两种元素,做仔细的区分。

理论说了这么多,那在我们做可视化图表的时候有什么作用呢?在可视化中,我们希望想让用户注意到重要的数据,可以用单一特征去引导用户的注意点。

上图图表,展示一个国内云厂商的用户占比情况之类的数据,大致如上。那作为本厂的产品腾讯云,我们希望观察者关注到腾讯云的数据,占比【50%】。但是上图的使用了多个视觉元素,没用突出目标项,这样就很难引导观察者的注意点。

修改上图图表,减少视觉元素的使用,我们再来看一个图。

从这个图表来看,只使用一个目标项和一个干扰项作为视觉元素的差异,我们就可以去引导观察者的注意点。引导到我们想要重点说明的数据上面去。

但是对于数据可视化来说,引导注意点,其目的是为了让观察者快速的去了解数据,而非刻意诱导,造成观察者的误解。

我们来看一个例子,上图是一个销售财年的报表,2015年销售额100万,2016年到达200万,从上图图表展示出来给观察者的信息就是,2016年比2015年销售额增长了1倍的样子。

但是我们把所有数据拉出来看,却发现出完全不同的事实,2013年销售额400万,2014年300万,2015年100万。2016年虽然比2015年增长了,但是和前几年相比有着明显的下滑,这就是一种图表展示的错误诱导的方式。

这种在Y轴上诱导的方式很常见,经常【某额宝】上展示近几日收益的时候,通过图表好像3月15号的时候收益非常高,但是仔细去看Y轴上的数值,会发现其实3月15号比3月10号的收益增长只有0.6%的,但是感观上给观察者非常夸张的展示。

而按照坐标轴为0%来展示的情况,实际只是一个非常稳定的状态。

数据可视化的真正价值在于,让观察者轻松的理解数据的价值。“可视化感知”低层视觉系统(Preattentive Processing)是让观察者快速的找到重点数据所在,而非孤立数据导致传递给观察者错误的理解。

附录:

我们将图形的展示时间设置为200毫秒,只设置一个视觉元素(形状) 。“圆形”作为目标对象,“长条形”作为干扰对象。测试观察“可视化感知”的低层视觉系统(Preattentive Processing)的实际作用。

除了上述列举的【形状】、【颜色】、【大小】、【对比】、【方向】。还列举出一下视觉元素的对比【密度】、【闭环】、【曲率】、【整体方向】、【投影方向】和【投影深度】。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏语言、知识与人工智能

【腾讯知文】任务型对话机器人简介

1.2K7
来自专栏SIGAI学习与实践平台

理解计算:从√2到AlphaGo ——第1季 从√2谈起

计算的概念看似简单却又十分宽泛,它实际上是计算机学科永远不变的核心内容,就算现在所谓的人工智能,在我看来也不过是一种计算或计算结果的应用。本文将从简单的例子出发...

933
来自专栏互联网高可用架构

小目标运动物体检测算法-Pipeline

1353
来自专栏机器之心

观点 | Reddit 热门话题:如何阅读并理解论文中的数学内容?

选自Reddit 机器之心编译 参与:Panda 有的机器学习论文中有大量的数学公式和推导过程,读这样的论文往往很是费力费时。为了了解阅读这样的论文的技巧,Re...

2798
来自专栏人工智能头条

深度学习和拓扑数据分析的六大惊人之举

1233
来自专栏灯塔大数据

每周学点大数据 | No.52众包算法例析

NO.52 众包算法例析 小可:讨论了这么多,我还是想通过一个具体的众包例子来了解一下众包算法。 Mr. 王:好,我们就从计算机的角度用具体的例子来分析一下众...

3307
来自专栏机器之心

资源 | 工程师必备!最好的九张机器学习&深度学习代码速查表

选自medium 作者:Kailash Ahirwar 机器之心编译 参与:黄小天 作者在 Github 上建立了一个代码速查表,对机器学习初学者来说是不可多得...

35512
来自专栏ATYUN订阅号

吉娃娃还是松饼?找到最好的计算机视觉API

下面这张在网上流传的图片展示了吉娃娃和松饼之间惊人的相似之处。这些图像通常在人工智能(AI)行业(包括我自己)的演示中共享。 ? 但有一个问题没有人回答过:在...

3378
来自专栏AI科技大本营的专栏

AI 行业实践精选:通过机器学习刺激销量——如何利用NLP挖掘潜在客户

【AI100 导读】在这篇博客中,作者会向大家介绍如何以更有效的方式通过 Xeneta 进行营销,会训练一个机器学习算法,通过对于公司的描述来预测潜在客户的质量...

3468
来自专栏大数据挖掘DT机器学习

从数据分析师笔试试题看职业要求

以下试题是来自阿里巴巴2011年招募实习生的一次笔试题,从笔试题的几个要求可见数据分析职业要求。 一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异...

3963

扫码关注云+社区