干货分享:如何学习关系网络可视化?

来源:余政彦

关系网络可视化之node-link:点与线构成的网络科学(network science)

移除我在美国东北大学信息设计艺术硕士项目(Master of Fine Arts in Information Design and Visualization)就读的第三个学期(2017秋季)修了四门课,其中一门课專注关系网络可视化(network visualization,又称graph visualization,图可视化)的探索与实践,属于计算机科学系博士班课程,一周上两次。

Cody Dunne

授课老师是Cody Dunne,在马里兰大学取得硕士与博士学位,师从Ben Shneiderman大神。Cody他专注在信息可视化、网络科学、人机交互等,在进入东北大学教书之前,他曾担任IBM研究单位的科学家。这门课配有两个助教(研究领域皆是关系网络可视化),负责解决作业问题与其他课程需求。

这门课是我在美国这一年半以来选到压力最大的一门,因为它属于计算机科学系博士班的课程,所以会有许多文献需要阅读;另外,部分作业很要求编程的能力;再加上每周需要上两次课,通常课程只需要一周上一次,每次三个半小时,这门课被切成两半,虽然总上课时数没有变,但课程压力增加许多,作业与每周阅读文献的量变成一般课程的两倍,例如周二上完课,我们必须在下一次上课前一天,也就周三(隔天周四上第二次课)之前到课程论坛上传文献阅读心得。

具体课程作业要求:

整个学期总共38篇文献需要阅读(每周约5至7篇,集中在课程前半部分),需要上传阅读心得(且带批判思维,不能只是梳理文献结果),然后上课的时候有小考。

整个学期有5门作业

图可视化工具实操(两人一组上台报告展示)、

2个D3可视化实作(一个为基础的图可视化实现,另一个为实现仪表板的交互可视化)、

文献报告(一人一组,选一篇文献上台报告)、

用代码实现一个经典的图可视化算法(是所有作业里的大魔王,反正我是花了两个整天耗在图书馆还是没有完成。。。)

期末专题:2至3人一组,与业界人士合作(从他们那边拿数据与了解他们的需求于需解决的问题),完成一个完整的图可视化开发(从草拟到可交互的交互可视化、撰写符合规范期刊格式的论文、上台报告展示等)

课程的详细信息与课件皆可以在这个网站查看与下载:https://codydunne.github.io/cs7295-f17

关系网络可视化,简而言之是用点(nodes)与线(edges)或矩阵(matrix)去呈现复杂数据之间的网络关系。这一系列的文章共有7篇(包括本篇),预计一周发一篇(求鞭策hhh),主要梳理了我在这门课学到的知识,从阅读文献到实际做一个关系网络可视化项目:

开篇简介

简要介绍关系网络可视化系列文章的内容。

文献泛读之1: node-link(点线) & matrix(矩阵)

牵涉到关系网络可视化的种类,大致可以分成两个类型,一个是使用node-link(点线)、另一个是使用matrix(矩阵)。在课堂的文献阅读中,可以很明显的了解,呈现关系网络可视化主要分成这两个阵营。node-link(点线)可以呈现较多细节资讯,但容易使关系网络可视化变得很复杂;matrix(矩阵)可以大幅简化关系网络,并清楚呈现两两之间的关系,但同时也遗失了关系网络数据中的部分重要信息,像是无法呈现地理信息。两者间的爱恨情仇会在这篇大致梳理。

a) Node-link 点线 & b) Matrix 矩阵

文献泛读之2: 可视化的视觉呈现

包括关系网络可视化,在呈现数据可视化时,需要注意颜色以及其他视觉元素的使用,如何避免使用错误的颜色而造成曲解、如何使用格式塔法则(Gestalt Principles)来辅助可视化,将在此文探讨。

使用彩虹色阶(左边)容易产生视觉曲解

文献泛读之3: 辅助视角的呈现(integration & coordinated views)

此章节会介绍如何使用其他数据可视化的样式来辅助关系网络可视化。如同仪表盘(dashboard),关系网络也会需要其他可视化来帮助使用者来探索与深入了解数据之间的网络关系。

移除左右两个不同视角的可视化可以辅助使用者了解同一个数据

左右两个不同视角的可视化可以辅助使用者了解同一个数据

关系网络可视化工具:gephi

选一个网络可视化工具并上台报告是这门课的作业之一,可以选择的工具有:Gephi、NodeXL、Cytoscape 、Tulip、Visone 等等,我们这组(两个人)选了gephi。gephi的特色在易于操作以及可以呈现动态网络关系等,但因为它也是一个开源的工具,所以有许多坑。此篇将手把手讲解如何使用Gephi的基本功能以及会遇到的问题。

gephi

文献报告

此篇也是课堂的其中一个作业,每个人需要选一篇文献(由老师列出,其他文献可以在课程网站的Paper Presentations查看)精读并上台报告。我选的是《Many-to-Many Geographically-Embedded Flow Visualisation- An Evaluation》,发表于2016年。对于我而言,这篇论文的特点在于列举的文献与数理相当具有逻辑,可以从这篇文章的文献综述去了解为何作者要提出一个新的关系网络可视化样式来解决问题;另外,文章中详细讲解一个新的关系网络可视化样式的设计过程以及如何设计实验来检测该可视化,也是我获益良多的部分。

如何在node-link与matrix之间取舍,是此篇文献的一个重点

期末项目

作为课程的重点项目,我跟一个同学合作,从数据选取、问题探索、可视化样式脑力激荡、编程使用,从头到尾的做出一个可以交互的可视化与一篇结构完整、已经可以发表的论文。此篇将呈现整个项目设计过程。

期末项目的截图

以上,新年快乐。

参考文献:

M. Ghoniem, J.-D.Fekete, and P. Castagliola, “A Comparison of theReadability of Graphs Using Node-Link and Matrix-Based Representations,”IEEE Symposium on Information Visualization, 2004.

Stef van den Elzenand Jarke J. van Wijk, “Multivariate NetworkExploration and Presentation: From Detail to Overview via Selections andAggregations,” 2014.

Michelle A. Borkinet al., “Evaluation of Artery Visualizations for HeartDisease Diagnosis,” 2011.

Yalong Yang et al., “Many-to-ManyGeographically-Embedded Flow Visualisation- An Evaluation,” 2016.

本文来自企鹅号 - 图纸集媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

17岁高中生都发AI论文了!OpenAI实习生提出分层强化学习新算法

409120
来自专栏CVer

免费资源 | 机器学习 新手快速入门

昨天正式开启了CVer免费赠书:送7本实体书(包邮) 活动,其中、有 4种赠书方式,Amusi也觉得赠的书不多,反而赠书方式多了,甚至觉得自己往营销方面跑了。因...

28820
来自专栏量子位

迁移学习比赛:OpenAI喊你重温「音速小子索尼克」

可算法的训练和测试环境都是同一个,这就会让那些本身带有超参数和靠死记硬背的算法获得不错的结果。

9610
来自专栏hadoop学习笔记

自然语言处理怎么最快入门?

自然语言处理说白了,就是让机器去帮助我们完成一些语言层面的事情,典型的比如:情感分析、文本摘要、自动问答等等。我们日常场景中比较常见到的类似Siri、微软小冰之...

13420
来自专栏企鹅号快讯

机器视觉技术原理解析及应用领域

01 简介 机器视觉是一项综合技术,包括图像处理、机械工程技术、控制、电光源照明、光学成像、传感器、模拟与数字视频技术、计算机软硬件技术(图像增强和分析算法、图...

98660
来自专栏CVer

三个牛人教你怎么高效阅读论文

写论文做研究的时候少不了要看论文,但是很多时候看过同类的论文之后发觉什么也没记住,本文将有三位牛人想大家分享他们在阅读论文的一些技巧,希望对大家有用。

14830
来自专栏量子位

这个变态级难度的小游戏,只为证明:人类的聪明没那么简单

先别说话。 给自己几分钟的时间,玩一下这个游戏,看看是否能顺利通关。几分钟就好,别为难自己。因为普通人通关平均需要20分钟。 游戏地址:https://high...

36760
来自专栏AI科技评论

视频 | 进化策略让AI开挂,玩游戏不断给自己续命

针对部分具有挑战性的深度强化学习问题,比如雅达利游戏,已经有研究表明,进化策略(Evolution Strategies)是强化学习的可行替代方案。

10720
来自专栏人工智能头条

聊天机器人中的深度学习技术(引言)

28770
来自专栏目标检测和深度学习

牛人教你高效读论文

16120

扫码关注云+社区

领取腾讯云代金券