有了这些创意美学,城市数据的趣味性超乎你的想象

你访问过政府开放数据网站吗?虽然开放的数据越来越多,但“可用性有待改善”仍是不少公众对这类网站的共同看法。如何才能让开放数据更好用,并打通公共数据到普通公众的“最后一公里”?通过可视化让数据变有趣,或许是解决方法之一。在1月3日的数据侠线上实验室中,DT君邀请到上海大学美术学院信息交互设计工作室的李谦升老师,为大家带来了来自美术学院的解决方案。

▍“有意义”的可视化和“有意思”的可视化

今天我们讨论的话题是“可视化酷玩法——如何让城市公共数据更有趣”。这个标题是DT财经方面起的,我觉得特别贴合我今天想讲的内容。

我的内容分享主要分成两个部分:一是数据可视化,我们作为2017年上海开放数据创新应用大赛(SODA)中的一支来自美术学院的参赛队伍,最擅长的就是数据的可视化,包括交互设计。

在这个部分,我会结合我们的参赛作品和案例,看看城市公共数据的新玩法。

第二个部分,是分享我们上海大学美术学院信息交互设计工作室在可视化方面的其他一些创新做法,以及我个人对数据可视化的一些感想。

在进入第一部分内容之前,我想先通过两个例子,让大家有所思考:我们做可视化,是为了有意义,还是有意思?

第一个例子是杭州城市交通的可视化。通过智慧交通的可视化大屏,展现了很多有用的信息,图表形式上也非常丰富,这其实就是一种很有意义的可视化方式。

第二个例子则是这样的:有两位设计师,一位住在伦敦,一位住在纽约。他们每个星期都会干同一件事情,就是把每个星期生活中的一些小事都用数据记录下来,比如笑了多少次,吃了多少次饭等,都是些鸡毛蒜皮的小事。然后,他们会将这些数据绘成漂亮的明信片,寄给对方。明信片的正面是一幅非常漂亮的可视化图表,背面则是关于这个图的一些解释。这个项目持续了一年时间。这种其实就属于有意思的可视化。

什么时候需要有意义?什么时候又需要有意思?

这是个很有意思的问题。在我看来,当你的可视化是需要面向大众的时候,有意思就显得更加重要。而当你的受众比较窄的时候,比如在某位老总的办公室中放一块可视化的大屏,他需要的可能就不是那么有意思的东西,而是要有直接的信息。

回到我们今天的第一部分内容,如何才能让城市公共数据更有趣。当我们把政府开放数据网站上的数据下载下来之后,会发现这些数据的格式主要是Excel、CSV等,这样的文件,除了程序员或数据分析师等专业人士之外,对普通人而言,并不太好用。有什么改进方法吗?当然有。

▍用“有意思”的可视化打通民众和公共数据的通道

城市公共数据“难用”,这是我们去年参加SODA大赛想要去解决的主要问题。从我们美术专业的角度来看这个问题,解决的方法在于可视化。

通过数据可视化,我们能够帮公众和公共数据之间建立一个通道,让民众可以方便、简单地去使用开放数据,去“把玩”、探索,从而让这些公共数据的价值能够发挥出来。

我们为此专门建立了一个叫做“DataSH”的网站,希望能对城市公共数据进行可视化的集中探索。这个网站实现了三大功能:

第一块是数据探索。我们设计了十种最基本的图表,可以让用户很方便地从时间、空间的维度,来从不同的角度对公共数据进行探索。图表部分,我们是基于百度Echarts来做的,因为Echarts的数据表封装已经非常好了,我们只需要按照其数据接口,往其中填数据即可。

第二个功能则是城市数据故事。在这个部分,我们会对一些有意思的公共数据进行可视化,然后再配合文字,做一些数据故事的专题,将数据融入故事,大众也更有意愿去读、去看。

举个具体例子。下图是上海地质资料信息共享平台的网站。在这个平台上,开放了很多地质有关的数据,其中有一个很有意思的数据是关于上海市地面沉降的。大家都知道上海这座城市的地面每年都在往下沉。但一般人并不会到这个平台上来专门看相关数据。为此,我们做了一个互动的可视化作品。

反映的是从1921年到2010年间,每隔10年,上海的地面沉降的状况。从图表中可以看出上海的地面是如何沉降的,还包括沉降速度。

从中我们能够观察到很多现象:比如在60年代以前,上海市的沉降范围很小,但是沉降的速度很快。图中越红的地方,就代表沉降速度越快。而到了60年代之后,城市每年都在不断对外扩大,但是沉降的速度是放慢的。如果你仔细观察,还可以去具体分析哪个地方沉降比较严重等等。

另外一个例子,是我们做的上海市古树名木地图。一般树龄在100年以上的树木都称之为古树,上海市有不少古树名木,大概有二、三千棵,分布在上海的各个地区。这样的数据政府也公布了。这些数据的格式当然也是Excel,对于普通人来说,这样的二、三千条数据,对他们并无太大的意义。

我们将这些古树的数据同样做成了一个互动的网站。下图是网站的部分截图,在图中,我们通过不同的颜色、圆圈大小来表明古树的生长状态(濒危、生长良好等)、所在地区(外环外、内中环、中外环、内环内等)、树种、树龄等。

比如,上海市有好几棵千年银杏,代表树龄的圆圈就特别大。在这个网站上,用户可以进行互动,通过选择菜单、切换不同的模式,获得不同的视觉效果。

通过这样做,我们希望能将这些数据做得更有意思、更简单、更清楚,民众也更愿意去看、去玩这些数据。

民众喜欢什么样的数据?我觉得广东佛山南海区的做法值得借鉴。他们曾经统计过数据开放网站最受欢迎(下载量最高)的数据类型,能够看出哪些数据是热点数据、哪些更受欢迎。我觉得上海市的政府数据开放平台也可以做这样的事情,可以看市民对哪些开放数据最有兴趣、有迫切需要。

第三个功能则是数据工具。我们希望将我们的作品再提高一个层次,除了用可视化把这些数据的价值体现出来之外,我们还希望利用数据工具来辅助公众做出决策。在这个部分,我们目前正在努力去设计一套好的工具。而其实在国外,已经有了先例。比如,《纽约时报》在2013年做了一个案例,我觉得特别符合我对数据工具的期待:

在这个例子中,图的左边是当地的一些关于房屋的数据,你输进去一些数字,比如房价、房贷利率、要在这个城市待多久等,输入之后,右边就会显出一个数字。这个数字可以提供参考,到底在当地租房合适还是买房更合适。这个工具特别简单又易用,可以辅助民众去进行判断、决策。

▍有意思的可视化,不一定要在“纸上”

我在开头也提到了,对公众而言,我觉得“有意思”是可视化当中非常重要的要素。特别是当你面对的是普通公众的时候,那么有意思就显得更加的重要。

对于做可视化的人来说,你可能需要掌握一些可视化的基本知识,比如你需要按照人眼对各种图形的敏感度去选择图形,或者需要基于不同类型的数据去选择图形。这是可视化的基本原理。

但是如果你完全按照上面的这些规则去做,做出来的可视化可能就会显得没有意思。

多年以来,不少人都总结出相关的经验与方法论,比如何时使用柱状图,何时用曲线图、饼图等等,按照这一套做法去做,你会把数据表现得很清楚,但是却缺少了趣味。

同样是公共数据,我们能不能找到一些新的办法、新的材质、新的形式去表现它,让它显得更有趣呢。我们在这方面做了一些尝试。

下图是我们之前做的一次展览的实验,就如图上可以看到的,比如上海市消防局的分布,我们没有用简单的图形来表示,而是用实体的管子的方式。当然我们会生成一个沃罗诺伊图代表某个消防局的覆盖范围,这同样也是一种可视化。普通的大众看到这个东西,也特别容易理解。

类似的例子还有停车场。我们从政府开放数据网站上下载了全上海市停车场的分布数据,比如它们每个小时的收费价格(3元/小时、4元/小时等,最高为11元/小时。)

对于这样的数据,我们也可以用模型、沙盘的形式呈现出来。从下面这个图上,你就同样能直观看出不同价格的停车场的分布情况。

另外,前面提到的古树名木,我们也有新的做法,我们用一根线代表10棵古树,然后用了一个瀑布图的形式。每根绳子对应着自己的属性。这样做,尽管可能没有柱状图、饼图表现得那么清晰,但是形式上却相对有趣。

之前我们在做展览的时候,就会发现,很多人对数据本身并没有兴趣,但是他们觉得形式上很有意思,特别容易接受。这也让我们觉得,我们的不同做法,在可视化方面给观众也是有哪怕一丝的作用的。

不仅仅是城市数据,其实我们也关注其他有意思的数据。

我跟大家分享另一个案例,这也是我们前不久为一个展览做的。背景是这样的:我们所在的学院为手工艺人开办了一个培训班,学员的背景、姓名、男女比例等数据,都记录在了Excel表格中。这其实还是比较简单的,但我们最后做成了一个照片墙的形式:将这些无趣枯燥的数据展示出来。

当这些学员看到这个作品时候,都觉得很有趣,首先他们会被自己的照片吸引,然后还可以看到屏幕中的其他图形,比如,他可以了解到学员中学刺绣的有多少、哪些人喜欢羌绣等等。

另一个例子,则是藏传佛教里面的唐卡。对于佛教中的人物形象,在画唐卡时是有严格的比例尺寸的。这套标准的背后其实是一些简单的数学比例关系,我们对此也做了一个互动的可视化网站:

网站上的互动操作也很简单,用户可以自己去拉动不同的比例线,右边的数字就代表你拖动的这个比例是不是符合金属上的比例。如果是100%就意味着完全符合,而数字越低就意味着越不符合标准的比例。

另外,我们还尝试了用传感器来收集一些有意思的数据。比如写毛笔字。传感器会记录你画东西、做手工艺时候的肌肉变化等。我们希望能够通过数据的方式,把这些手工艺的技法给保存下来。

除了用图形去做可视化,我们也在想能不能用机械的方式、不同的材质去做可视化。比如说,我们可以用机器来控制磁流体,让磁流体变成不同的形状。

为了实现这样的效果,我们做了一个机器的矩阵,来控制前面的磁流体。下图就是我们背后那个机器原型的样子:

类似的实验,我们做了很多。

怎么样从数据到图形,这背后其实涉及到很多技术手段。对于今后,我们希望能够用新的方法、技术和形式来获取数据、表现数据之外,也能够更多去探索数据背后的秘密。

注:以上内容根据李谦升在数据侠线上实验室的演讲实录整理,有删减及部分调整,已经本人审阅。本文仅为作者观点,不代表DT财经立场。

作者 | 李谦升

编辑 | 胡世龙 : hushilong@dtcj.com

题图 | 视觉中国

▍数据侠门派

本文数据侠李谦升,上海大学美术学院教师,2017年SODA大赛“未来之星”奖获奖团队“SHU_VIZ_GROUP”队长。主要研究兴趣在数据可视化、信息交互设计等。

原文发布于微信公众号 - DT数据侠(DTdatahero)

原文发表时间:2018-01-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏杨熹的专栏

数据科学家养成路线

先挂上一张大概一年前就火了的数据科学的技能列表图,乍一看很像地铁图,极客范儿们会不会默默地把它当作桌面呢。一看到十大类的这么多技能,又兴奋又压力,如此高能还是不...

43060
来自专栏程序员笔记

首先要有个想法

14360
来自专栏养码场

跳出来看看,技术真的不是你一辈子的金饭碗

原本不想在工作日分享给大家这篇毒鸡汤,可里面的很多观念和想法,确实刺激到了场主,或者也能说到正在看这篇文章的你吧。

10540
来自专栏CDA数据分析师

被裁员后,我是如何成功找到了一份数据科学工作

本文的目的为了告诉你们我是如何成功找到一份数据科学的工作。从被裁员到成功签约,这两个月对我来说即辛苦又紧张。

15820
来自专栏DT数据侠

重新认识地铁上的深圳:2017深圳城市大数据活跃报告

如何用大数据来理解深圳?在数据侠实验室16期活动现场,DT财经发布《2017深圳城市大数据活跃报告》,用58张数据图表与4万字,提供一个新的视角。

9400
来自专栏数据的力量

产品运营黑魔法:用户在贡献内容时他们在想什么

18150
来自专栏程序员笔记

从大脑的模式识别到游戏到快乐体验

20940
来自专栏老九学堂

程序员的10大成功面试技巧

1.给自己写一份非常专业的简历 老九君的建议是,如果你想增加自己的入选机会,那最好还是花点钱制作一份专业的简历。相较于你将来可能得到的巨大收获,这真的只是一个小...

28960
来自专栏悦思悦读

IT行业技术人员的核心竞争力

本文作者从一个IT老兵的角度,讲讲自己对于IT行业的技术人员核心竞争力的看法。此处说的IT技术人员就是engineer(以开发为例)。立意在于普通员工。是作者从...

432100
来自专栏机器学习算法与Python学习

有人对他说:如果连 Python 都学不会,你就不要学编程了

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 前段时间,有读者在后台留言问我,「新...

40250

扫码关注云+社区

领取腾讯云代金券