干货分享:如何学习关系网络可视化?

来源:余政彦

关系网络可视化之node-link:点与线构成的网络科学(network science)

移除我在美国东北大学信息设计艺术硕士项目(Master of Fine Arts in Information Design and Visualization)就读的第三个学期(2017秋季)修了四门课,其中一门课專注关系网络可视化(network visualization,又称graph visualization,图可视化)的探索与实践,属于计算机科学系博士班课程,一周上两次。

Cody Dunne

授课老师是Cody Dunne,在马里兰大学取得硕士与博士学位,师从Ben Shneiderman大神。Cody他专注在信息可视化、网络科学、人机交互等,在进入东北大学教书之前,他曾担任IBM研究单位的科学家。这门课配有两个助教(研究领域皆是关系网络可视化),负责解决作业问题与其他课程需求。

这门课是我在美国这一年半以来选到压力最大的一门,因为它属于计算机科学系博士班的课程,所以会有许多文献需要阅读;另外,部分作业很要求编程的能力;再加上每周需要上两次课,通常课程只需要一周上一次,每次三个半小时,这门课被切成两半,虽然总上课时数没有变,但课程压力增加许多,作业与每周阅读文献的量变成一般课程的两倍,例如周二上完课,我们必须在下一次上课前一天,也就周三(隔天周四上第二次课)之前到课程论坛上传文献阅读心得。

具体课程作业要求:

整个学期总共38篇文献需要阅读(每周约5至7篇,集中在课程前半部分),需要上传阅读心得(且带批判思维,不能只是梳理文献结果),然后上课的时候有小考。

整个学期有5门作业

图可视化工具实操(两人一组上台报告展示)、

2个D3可视化实作(一个为基础的图可视化实现,另一个为实现仪表板的交互可视化)、

文献报告(一人一组,选一篇文献上台报告)、

用代码实现一个经典的图可视化算法(是所有作业里的大魔王,反正我是花了两个整天耗在图书馆还是没有完成。。。)

期末专题:2至3人一组,与业界人士合作(从他们那边拿数据与了解他们的需求于需解决的问题),完成一个完整的图可视化开发(从草拟到可交互的交互可视化、撰写符合规范期刊格式的论文、上台报告展示等)

课程的详细信息与课件皆可以在这个网站查看与下载:https://codydunne.github.io/cs7295-f17

关系网络可视化,简而言之是用点(nodes)与线(edges)或矩阵(matrix)去呈现复杂数据之间的网络关系。这一系列的文章共有7篇(包括本篇),预计一周发一篇(求鞭策hhh),主要梳理了我在这门课学到的知识,从阅读文献到实际做一个关系网络可视化项目:

开篇简介

简要介绍关系网络可视化系列文章的内容。

文献泛读之1: node-link(点线) & matrix(矩阵)

牵涉到关系网络可视化的种类,大致可以分成两个类型,一个是使用node-link(点线)、另一个是使用matrix(矩阵)。在课堂的文献阅读中,可以很明显的了解,呈现关系网络可视化主要分成这两个阵营。node-link(点线)可以呈现较多细节资讯,但容易使关系网络可视化变得很复杂;matrix(矩阵)可以大幅简化关系网络,并清楚呈现两两之间的关系,但同时也遗失了关系网络数据中的部分重要信息,像是无法呈现地理信息。两者间的爱恨情仇会在这篇大致梳理。

a) Node-link 点线 & b) Matrix 矩阵

文献泛读之2: 可视化的视觉呈现

包括关系网络可视化,在呈现数据可视化时,需要注意颜色以及其他视觉元素的使用,如何避免使用错误的颜色而造成曲解、如何使用格式塔法则(Gestalt Principles)来辅助可视化,将在此文探讨。

使用彩虹色阶(左边)容易产生视觉曲解

文献泛读之3: 辅助视角的呈现(integration & coordinated views)

此章节会介绍如何使用其他数据可视化的样式来辅助关系网络可视化。如同仪表盘(dashboard),关系网络也会需要其他可视化来帮助使用者来探索与深入了解数据之间的网络关系。

移除左右两个不同视角的可视化可以辅助使用者了解同一个数据

左右两个不同视角的可视化可以辅助使用者了解同一个数据

关系网络可视化工具:gephi

选一个网络可视化工具并上台报告是这门课的作业之一,可以选择的工具有:Gephi、NodeXL、Cytoscape 、Tulip、Visone 等等,我们这组(两个人)选了gephi。gephi的特色在易于操作以及可以呈现动态网络关系等,但因为它也是一个开源的工具,所以有许多坑。此篇将手把手讲解如何使用Gephi的基本功能以及会遇到的问题。

gephi

文献报告

此篇也是课堂的其中一个作业,每个人需要选一篇文献(由老师列出,其他文献可以在课程网站的Paper Presentations查看)精读并上台报告。我选的是《Many-to-Many Geographically-Embedded Flow Visualisation- An Evaluation》,发表于2016年。对于我而言,这篇论文的特点在于列举的文献与数理相当具有逻辑,可以从这篇文章的文献综述去了解为何作者要提出一个新的关系网络可视化样式来解决问题;另外,文章中详细讲解一个新的关系网络可视化样式的设计过程以及如何设计实验来检测该可视化,也是我获益良多的部分。

如何在node-link与matrix之间取舍,是此篇文献的一个重点

期末项目

作为课程的重点项目,我跟一个同学合作,从数据选取、问题探索、可视化样式脑力激荡、编程使用,从头到尾的做出一个可以交互的可视化与一篇结构完整、已经可以发表的论文。此篇将呈现整个项目设计过程。

期末项目的截图

以上,新年快乐。

参考文献:

M. Ghoniem, J.-D.Fekete, and P. Castagliola, “A Comparison of theReadability of Graphs Using Node-Link and Matrix-Based Representations,”IEEE Symposium on Information Visualization, 2004.

Stef van den Elzenand Jarke J. van Wijk, “Multivariate NetworkExploration and Presentation: From Detail to Overview via Selections andAggregations,” 2014.

Michelle A. Borkinet al., “Evaluation of Artery Visualizations for HeartDisease Diagnosis,” 2011.

Yalong Yang et al., “Many-to-ManyGeographically-Embedded Flow Visualisation- An Evaluation,” 2016.

本文来自企鹅号 - 图纸集媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

17岁高中生都发AI论文了!OpenAI实习生提出分层强化学习新算法

OpenAI 成立近两年,发表了大量研究论文,而这周四的一篇论文却与众不同:其第一作者是名高中生。这位少年英才叫 Kevin Frans,就读于 Henry M...

1013
来自专栏AI科技评论

视频 | 进化策略让AI开挂,玩游戏不断给自己续命

针对部分具有挑战性的深度强化学习问题,比如雅达利游戏,已经有研究表明,进化策略(Evolution Strategies)是强化学习的可行替代方案。

942
来自专栏机器之心

专访 | Gamma Lab:让机器回答一个自然语言问题需要几步?

人类从一百二十万年前就开始制造机器了。阿基米德的杠杆给了我们力量,伽利略与达芬奇的动力学给了我们速度与空间,而计算机科学将取之不尽的信息从广阔的世界里吸收过来呈...

1282
来自专栏大数据挖掘DT机器学习

基于微软案例数据库数据挖掘知识点总结(Microsoft 聚类分析算法)

本篇文章主要是继续上一篇Microsoft决策树分析算法后,采用另外一种分析算法对目标顾客群体的挖掘,同样的利用微软案例数据进行简要总结。 应用场景介绍 通过上...

3045
来自专栏大数据文摘

【译】统计学教会我们的10件事

1979
来自专栏CVer

免费资源 | 机器学习 新手快速入门

昨天正式开启了CVer免费赠书:送7本实体书(包邮) 活动,其中、有 4种赠书方式,Amusi也觉得赠的书不多,反而赠书方式多了,甚至觉得自己往营销方面跑了。因...

2062
来自专栏TEG云端专业号的专栏

全国知识图谱与语义计算大会 - 实体发现与链接比赛总结

一 背景 互联网大数据时代中,随着机器语义理解需求的日益增长,知识图谱,即各类实体、概念及其之间的语义关系,日益成为大数据时代知识表示的主要形态之一,并在学术界...

8667
来自专栏机器学习算法与Python学习

学界 | 推荐系统顶会 RecSys2018 最佳论文奖出炉!因果嵌入推荐与用户研究成为焦点

RecSys 2018 的最佳长论文(Best Long Paper Award)由 Criteo 人工智能实验室的 Stephen Bonner 和 Flav...

1342
来自专栏AI科技评论

业界 | 一文看懂谷歌 NYC 算法与优化业务全景(附重点论文下载)

AI 科技评论消息,众所周知,谷歌的研究团队遍布世界各地,而纽约自然也是非常重要的一个地点,尤其是多个谷歌算法研究小组的孕育地。目前,谷歌算法优化团队为谷歌产品...

3516
来自专栏企鹅号快讯

机器视觉技术原理解析及应用领域

01 简介 机器视觉是一项综合技术,包括图像处理、机械工程技术、控制、电光源照明、光学成像、传感器、模拟与数字视频技术、计算机软硬件技术(图像增强和分析算法、图...

7556

扫码关注云+社区