遇见大数据可视化 : 图表的视觉系统感知

在上篇两篇文章里《遇见大数据可视化:基础研究》《遇见大数据可视化 :来做一个数据可视化报表》,简单的介绍了下可视化的基础和制作流程。我们也发现将数据进行可视化的好处,可以清晰有效的传达数据信息,以实现“用视觉的方式去思考”。相比数据的公平,视觉的方式会带有一定的引导性。

如上图所示,我们能快速的发现图形上的不同之处。NSF的图形和图像处理小组称之为“可视化感知”,人眼的启动时间至少需要200毫秒,在启动时间内能感知到区别的存在(*见附录) 。上图就是一种简单的预先处理感知实例,目标对象具有视觉属性“圆形”,“长条形”干扰物对象没有(所有非目标对象都被认为是干扰物)。观察者一眼就能知道目标对象是否存在还是不存在。

这种“可视化感知”实际上是运用人眼低层视觉系统(Preattentive Processing)的引发的快速感知特征。能够迅速的引发预设在图形中的潜在目标对象的注意。所以我们在可视化设计中可以运用这一特点,快速的迁移观察者的注意点。

按照Anne Treisman在早期提出特征理论(Feature integration theory人类视觉注意力最有影响力的心理模型之一),我们可以继续去寻找影响【个体特征】的视觉属性点。

通过去预设目标对象和干扰对象的颜色、大小、对比和方向的不同特征属性。观察者也可以快速的通过这种“特征搜索” 迁移注意点。

之所以很快就能找到这些注意点,因为它们跟其干扰项相比,最多只相差了一种视觉元素。比如,红色线条和黑色线条,长线条和短线条。当只有一种视觉元素的时候,我们的视觉系统中的低层视觉系统(Preattentive Processing) 就起作用了,它可以平行处理所有在图中出现的点,然后很快找到特征点。我们再来看下反例

跟上面的例子相比,我们要花相对长的时间找到那个注意点。原因很简单,因为图中使用了两种视觉元素来区分特殊点,颜色和大小,方向和对比。在这种情况下,我们的低层视觉系统(Preattentive Processing)就不行了,视觉系统需要一个一个的处理每个点,识别两种元素,做仔细的区分。

理论说了这么多,那在我们做可视化图表的时候有什么作用呢?在可视化中,我们希望想让用户注意到重要的数据,可以用单一特征去引导用户的注意点。

上图图表,展示一个国内云厂商的用户占比情况之类的数据,大致如上。那作为本厂的产品腾讯云,我们希望观察者关注到腾讯云的数据,占比【50%】。但是上图的使用了多个视觉元素,没用突出目标项,这样就很难引导观察者的注意点。

修改上图图表,减少视觉元素的使用,我们再来看一个图。

从这个图表来看,只使用一个目标项和一个干扰项作为视觉元素的差异,我们就可以去引导观察者的注意点。引导到我们想要重点说明的数据上面去。

但是对于数据可视化来说,引导注意点,其目的是为了让观察者快速的去了解数据,而非刻意诱导,造成观察者的误解。

我们来看一个例子,上图是一个销售财年的报表,2015年销售额100万,2016年到达200万,从上图图表展示出来给观察者的信息就是,2016年比2015年销售额增长了1倍的样子。

但是我们把所有数据拉出来看,却发现出完全不同的事实,2013年销售额400万,2014年300万,2015年100万。2016年虽然比2015年增长了,但是和前几年相比有着明显的下滑,这就是一种图表展示的错误诱导的方式。

这种在Y轴上诱导的方式很常见,经常【某额宝】上展示近几日收益的时候,通过图表好像3月15号的时候收益非常高,但是仔细去看Y轴上的数值,会发现其实3月15号比3月10号的收益增长只有0.6%的,但是感观上给观察者非常夸张的展示。

而按照坐标轴为0%来展示的情况,实际只是一个非常稳定的状态。

数据可视化的真正价值在于,让观察者轻松的理解数据的价值。“可视化感知”低层视觉系统(Preattentive Processing)是让观察者快速的找到重点数据所在,而非孤立数据导致传递给观察者错误的理解。

附录:

我们将图形的展示时间设置为200毫秒,只设置一个视觉元素(形状) 。“圆形”作为目标对象,“长条形”作为干扰对象。测试观察“可视化感知”的低层视觉系统(Preattentive Processing)的实际作用。

除了上述列举的【形状】、【颜色】、【大小】、【对比】、【方向】。还列举出一下视觉元素的对比【密度】、【闭环】、【曲率】、【整体方向】、【投影方向】和【投影深度】。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

数据挖掘知识脉络与资源整理(十一)–数据质量分析

? ? 数据质量分析 1、 简介 传统意义上,数据分析分两类:EDA(Exploratory Data Analysis,探索性分析)和CDA(Confi...

2837
来自专栏大数据文摘

AI = 神经网络?这8个技术就不是!

782
来自专栏ATYUN订阅号

利用机器学习为广告生成有说服力的面孔

匹兹堡大学的研究人员最近开发了一种条件变化的自动编码器,可以为广告制作独特的面孔。他们的研究基于他们以前的工作,探索了更好地理解广告的自动化方法。

532
来自专栏AI科技大本营的专栏

一文详解知识图谱关键技术与应用 | 公开课笔记

本课程从知识图谱的历史由来开展,讲述知识图谱与人工智能的关系与现状;知识图谱辐射至各行业领域的应用;在知识图谱关键技术概念与工具的实践应用中,本课程也会讲解知识...

1145
来自专栏腾讯大数据的专栏

OCR—探寻文字真实的容颜

文字,一种信息记录的图像符号,千年来承载了太多的人类文明印记。OCR,一种自动解读这种图像符号的技术,一直以来都备受关注。尤其在信息时代的今天,数字图像纷繁复杂...

5867
来自专栏cloudskyme

跟我一起数据挖掘(18)——什么是数据挖掘(1)

什么是数据挖掘 前两天看到群里有人问,什么是数据挖掘,现在就数据挖掘的概念做一下分析,并且尽量用大白话说一下数据挖掘到底是个啥东西,为啥大数据来了数据挖掘也火了...

3417
来自专栏AI科技评论

动态 | 迪士尼也来研究人工智能啦,将AI用于动画制作

AI科技评论按:众所周知,卡耐基梅隆大学在计算机科学方面的研究名列前茅,而迪士尼有意将计算机科学技术引入动画制作。他们与卡耐基梅隆大学合作建立的实验室近日发表了...

3224
来自专栏互联网杂技

美丽的数据——数据可视化与信息可视化浅谈

我们常常迷失在数据中,纷繁复杂的数据让我们无所适从。可视化作为解决这问题的有效手段,通过视觉的方式让数字易于理解。 数据可视化和信息可视化都是可视化的一种方式,...

26411
来自专栏大数据挖掘DT机器学习

从数据分析师笔试试题看职业要求

以下试题是来自阿里巴巴2011年招募实习生的一次笔试题,从笔试题的几个要求可见数据分析职业要求。 一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异...

3853
来自专栏大数据文摘

统计学速成班:谷歌首席决策工程师的一分钟入门指南

假设检验,P值,显著性水平,置信区间,功效分析到底是什么呢?这里有一份通俗易懂的讲解指南。本文介绍了统计学两大学派:频率学派和贝叶斯学派的基本观点,一起来看看大...

976

扫码关注云+社区