前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【数据可视化】读图时代可视化及其技术分析

【数据可视化】读图时代可视化及其技术分析

作者头像
陆勤_数据人网
发布2018-02-27 15:15:04
1.6K0
发布2018-02-27 15:15:04
举报
文章被收录于专栏:数据科学与人工智能

一、可视化的涵义

1、可视化的由来

“可视化”一词源于英文“Visualization”,译为“形象化”、“成就展现”等。事实上,将任何抽象的事物、过程变成图形图像等形象化的表示都可以称为可视化。

用可视化的手段来呈现信息已不是一个新奇的现象。最初的“可视化”可以追溯到几千年前,如古人洞穴里的绘画,而后的地图、科学图画和数据等。这些早期的可视化探索与运用在一定程度上以平直的向前方式对计算机形象化产生了重要影响。而可视化研究是一个新兴学科,它展现了一个迄今为止高度非结构化的研究领域,其中包括从事各个其他领域的学者,如人机交互、平面设计、管理、建筑等。

2、可视化的含义

确切地说,可视化是一个过程:它将数据、信息和知识转化为一种形象化的视觉表达形式。充分利用了人们对可视模式快速识别的自然能力,以形象化的姿态接受大众的解读。

3、可视化与表征

目前业内没有对“可视化”进行统一的称谓规定,很多时候把“可视化”与“表征”类同或者等同起来,在这里有必要对“可视化”与“表征”作一辨析。

表征(Representation)又称知识表征或心理表征,是认知心理学的核心概念之一,指信息或知识在心理活动中的表现和记载的方式。根据信息加工的观点,当有机体对外界信息进行加工(输入、编码、转换、存储和提取)时,这些信息是以表征的形式在头脑中出现的。

换言之,表征是外部事物在心理活动中的内部再现或表现。因此,它一方面反映客观事物,另一方面又是心理活动进一步加工的对象。同一事物,其表征的方式不同,对它的加工也不相同。信息的编码和存储有视觉形象形式和言语听觉形式,抽象概念或命题形式。那些具有形象性特征的表征,也称表象,是表征的一种形式。

综上,我们认为,表征更加侧重人对数据、信息和知识自下而上的加工过程。而可视化是将数据、信息和知识转化为一种形象化的视觉形式的过程,显然更加侧重人对数据、信息和知识自上而下的加工处理过程。如同两个箭头,形式上很相似,但实质上各自所指的方向不同,更不可同日而语。

有的学者还认为知识表征在认知心理学、人工智能以及知识可视化等领域有着不同含义。在认知心理学中,知识表征是指知识在人脑中的存储和组织形式,与此相对应的是人脑的各种记忆模型;在人工智能领域,知识表征指知识在计算机中的存储形式和运算机制,与此相对应的是数据结构和相应的算法;而在知识可视化领域,知识表征则是指知识的外在表现形式,与此相对应的是承载知识的图解手段,也是直接作用于人的感官的刺激材料。

我们认为,一方面,知识表征和可视化之间的归属关系,还有待商榷,笔者更倾向于把它们放在一种并列的位置,时有交叉;另一方面,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器,知识表示是人工智能学科研究的主要内容之一,与我们所探讨的知识表征意义相差甚远,不应该把“知识表示”和“知识表征”等同起来,作类比表述。

二、可视化的分类与技术

可视化分类法被用来实现用户需求与相关可视化技术的匹配。在研究者进行可视化技术的研究和用户进行可视化方案的设计时,首先应确定用户需求,然后以可视化分类方法为指导,从现有的可视化方法中选取合适的可视化方法。

1、文献中常用的可视化分类方法与技术

  • 科学计算可视化。主要是指计算或实验产生的数据的可视化方法研究,它面向的对象是科学计算和实验产生的数据。随着技术的发展,可视化的范围从科学计算产生的数据扩大到其他类型的数据,由此形成了数据可视化。
  • 现代的数据可视化技术指的是运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。数据可视化运用的技术有可视化视图(如电脑操作系统从DOS到Windows的变换、心电图等)、体绘制(Volume Rendering)、路径线和条纹线(Streamlines,Streaklines and PathLines)等(如图1)。
  • 信息可视化。信息可视化是指利用计算机支撑的、交互的,用抽象数据的可视表示,来增强人们对非物理抽象信息的认知。信息可视化运用的技术有直方图、树形图、矩阵、流程图、维恩图(Venn Diagram)、欧拉图(Euler Diagram)等。(如图2)。
  • 知识可视化(如图3)是指将人们的个体知识以图解的手段表示出来,形成能够直接作用于人的感官知识外在的表现形式,从而促进知识的传播和创新。除了传达事实信息之外,知识可视化的目标在于传输见解、经验、态度、价值观、期望、观点、意见和预测等,并以这种方式帮助他人正确地重构、记忆和应用这些知识。

目前国内对知识可视化的研究比较广泛,对知识可视化技术的研究和技术开发也在如火如荼地进行着。所用的工具主要有概念图、思维导图、认知地图、语义网络、思维地图等。

事实上,以上提到的文献常用的可视化分类方法只是可视化对应于某个特定领域的分类方法,这种分类方法是否可以算得上一个完整分类体系还有待进一步商榷。

2、其他的可视化分类方法

除了上文提到的分类方法外,还有几种比较新的可视化分类方法,在这里只对其做一简介:

  • 基于数据类型的可视化分类方法,Ben Shneiderman依据数据类型进行可视化分类,这种分类方法根据数据类型把信息可视化分为一维信息可视化、二维信息可视化、三维信息可视化、多维信息可视化、时间序列信息可视化、层次结构信息可视化和网络结构信息可视化。
  • 基于数据状态模型的可视化分类方法,Ed H.Chi从数据类型和数据处理过程的角度进行可视化分类方法研究,设计了一种基于数据状态模型的信息可视化分类方法(如图4),打破了以往仅根据数据类型对可视化方法进行分类的传统模式。
  • 基于可视数据分析技术的可视化分类方法,Daniel Keim提出一种基于可视数据分析技术的可视化分类方法,它从数据类型、可视化技术和交互变形技术的角度研究可视化分类方法(如图5)。这种分类方法认为数据可视化包括数据类型、数据可视化技术和交互变形技术这三要素,这三个要素构成了数据可视化。

以上三种分类方法给可视化研究领域带来了新的研究角度,但我们认为它们都过于抽象化,与可视化本身的“宗旨”不符,而且只适用于特定的专业背景之中。

3 基于数据组织律的分层可视化分类方法与技术

笔者在此作一理论假设:将“数据”作为一个基本单位和载体,通过数据的数字化、编码化、序列化和结构化形成信息、概念、隐喻、策略等。

  • 数据:对客观事物的符号表示,如图形符号、数字、字母等。它能对一个事实进行陈述,但是它是离散的、互不关联的客观事实,孤立的文字、数值和符号,缺乏关联性和目的性。
  • 信息:物质运动规律的总和,是赋予了意义的数据,是数据在信息媒介上的映射。
  • 概念:思维的基本形式之一,反映客观事物一般的、本质的特征。人类在认知过程中,把所感觉到的事物的本质属性与共同特征抽取出来,加以概括,就成为概念。
  • 隐喻:反映的是不同现实现象之间的相似关系,并不提出实在的知识。
  • 策略:即谋略,手段。
  • 知识:也叫复合知识,是最为复杂的数据矩阵,是以上几种数据形态的综合。

与此相对应,根据数据组织的复杂程度,把可视化进行如下层次化的分类:

  • 数据可视化:运用计算机图形学和图像处理技术,将数据转换为图形并进行交互处理的理论、方法和技术。所运用的技术手段主要有:点状图、面积图表或线图。
  • 信息可视化:是指利用计算机实现抽象数据的可视表示。其运用的主要技术手段为:语义网络或树图,旨在利用数据的交互式视觉陈述来加强认知。
  • 概念可视化:指对概念本身及概念之间的层次或归属关系的形象化表达,是一种详细说明定性概念、观念、规划和分析的方法,通过规则导向完成绘制。使用户能更好地理解概念的内涵和外延。其运用的主要技术手段为:概念图、甘特图(如图6)等。
  • 隐喻可视化:更倾向于自主建构的学习方式,充分发挥用户的想象力和创造力,激发他们更好、更快地建构知识。其运用的技术手段一般有故事板(Story Template)(如图7)等。
  • 策略可视化:提供问题解决的技术路线和操作纲领,其使用的技术手段一般为:流程图、卡通图(Cartoon)、漫画图等(如图8)。
  • 知识可视化:是对前五种可视化的集成和综合。

三、一种整合观:基于数据组织规律的分层可视化技术——可视化周期表

为了更有效地利用各类可视化方法,我们依据各类的相关性和不同点对各类可视化技术进行“编号”、“上架”,即构建可视化技术的“容器”和“仓库”,以此实现各类可视化方法的有效整合。经过查阅相关的国内外文献,这里主要介绍MartinJ.Eppler教授的“可视化周期表”(如图9)。此表充分体现了“分层”思想,形象直观地表现了各类可视化技术的相关性和不同点,更有利于技术之间的协作和融合。

1、可视化周期表

周期表是沿两个维度构建的:周期和分组。可视化的复杂度适合于“周期”,而应用领域适合于“分组”。

  • 数据可视化(Data Visualization)包括标准定量格式,如饼图(Pie Charts)、面积图(Area Charts)。它们是定量数据的代表,采用图解的形式,主要用于得到数据的概述。因为它们最活跃,容易与其他数据等进行“反应”,形成信息、策略等,故将它们归入到碱金属(1~2族)中。
  • 信息可视化(Information Visualization):是指利用数据的视觉表述来促进认知,具体表现形式为:数据被转化为一个图像被绘制到空间屏幕上,如语义网络(Semantic Networks)、树状图(Tree Maps),我们把这一类可视化方法放在应用最广泛的3~8族。
  • 概念可视化(Concept Visualization):这是一种详细说明概念、规划和分析的方法,通过规则导向来绘制具体过程。在概念可视化中,知识通常呈现在一个二维图形中,概念用定向的弧线连接,以此来表示概念间的相互关系,如图9~13族。
  • 隐喻可视化(Metaphor Visualization):隐喻可视化能够实现双重职能:首先是以图表定位信息,组织和建构它们;第二,它们通过应用隐喻的特征来传递一种想象力所代表的信息。如利用地铁图(Metromap)或故事板(Story Template)传达复杂的信息和内容。
  • 策略可视化(Strategy Visualization):系统地使用视觉陈述,来实施各种战略。如技术路线(Technology Roadmap)。
  • 复合可视化(CompoundVisualization):由以上几种可视化方法综合而成。

需要说明的是,有些可视化方法可以同属于一个以上的类别。以下是图例说明:任务与交互方面:

通过此周期表,我们并不是要揭示可视化的方法的组织原则,而是要强调一个事实:即对于某一特定要求,可能有不止有一种合适的可视化方法。相反,将不同的方法结合起来使用,可能会获得更好的效果。

2、可视化周期表的意义

构建大领域、宽范围的可视化方法的整合不能被看作是化学元素周期表中的简单套用和改编。可视化周期表为从业人员提供了种类繁多的可视化方法全景图,并通过上文所述规则来组织它们,从而协助从业人员根据自己的需求选择适当的可视化方法。此表可以鼓励从业人员去探索目前可视化方法不同的属性,考虑和利用不止一种的可视化方法完成策略的实施。

综上所述,通过文献综述,我们把典型的可视化方法纳入“化学元素周期表”这个“工具箱”中,实现一种层次性的结构。有利于从业人员在进行可视化及其技术开发的研究中,确定用户需求,通过可视化周期表,从现有的可视化方法中选取最有效的可视化方法。

通过可视化分类方法的指导,一方面易于从业人员借鉴他人的经验,快速地选取适合的可视化方法;另一方面也易于激发从业人员的思维,创造出更高效的可视化方法。

(文:吕永峰)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2015-12-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档