用数据讲故事:七种不同的数据展示方法

什么使一个故事真正成为数据驱动呢?在某种程度上,数字不再仅仅是出现在侧栏的表格,而是能够在真正意义上促进故事的发展。

数据可以帮助我们用不同视角叙述不同类型的故事。我在Tableau Public的同事Ben Jones鼓励我用七种不同的类型来构造数据故事((à la Christopher Booker的七个基本的故事情节)。Jones这个想法是根据大量数据故事的分析得出的,也可以帮助人们了解一些其他东西,使数据不再受限于侧栏表格。这些分类旨在让数据成为一个思想启动器而非我们看到的简单直白的结果,这样无疑提高了数据的用处。

我们通过由Freedom House(一个独立的监测机构)整理的数据来探讨一下每一种分类。这些数据将每个国家按照“自由”,“部分自由”以及“不自由”进行排名。使用这个简单的数据组,我们可以讲出七个不同的故事。角度则取决于你想通过这些数据表现什么以及你将如何展现这些数据。

叙述方式随着时间改变

对比2001年,有多少国家在2013年被划分为“自由”呢?事实证明随着时间变化,这个数字在急剧下降。我们可以通过数据将这种变化变得可视化,然后再解释导致变化的原因。

美国全国广播公司财经频道的John Schoen使用这种方法将Dow 30公司过去87年的历史可视化。使用者可以点击每十年看到数据是如何在每一次科技爆炸、70年代的通货膨胀、甚至是经济大萧条时发生变化的。美国全国广播公司财经频道的员工基于过去的趋势将这种可视化与未来的预测结合。

由大及小

数据可以引导读者具体深入到一个聚焦的点。用Freedom House的数据来说明,首先给读者一张标注得分的世界地图(整体画面),然后读者可以放大任意区域,比如亚洲,那么他会看到这个地区里一半以上的国家都被标注为“不自由”。甚至再放大一些,读者就会发现,朝鲜是所有国家里最不自由的。

我们通过在纸媒及互动媒体上给与提示来引导读者了解这种变化。

下面的这个例子展示了世界范围内疫苗预防疾病爆发的数据。这个概观展现了有多少例这种事例存在。读者可以通过选择国家、疾病或者年份深入阅读。读者可能会被引导看到一些其它相关的链接,比如,相比其他国家百日咳在美国更加盛行,并且文中会列出其原因。

由小及大

我们也可以逆推,这种由小视角扩展到大视角。例如,首先关注的是世界上最自由的三个国家(这三个国家可能都位于欧洲)。从这里开始,由小及大来展示欧洲其他国家的排序,然后再次扩大到展示全球的对比,接着读者就可以看到全世界只有超过三分之一的国家是“自由的”。

这是一个展示移民对住宅价值的影响的例子。读者可以通过他或她的邮政编码进入其当地的视图。接着互动的筛选会提供一个全州的视图以及一个有着全国视图的地图。

突出对比

在数据集里突出不同可以引出一个有力的叙述。最自由的十个国家都在欧洲,并且恰好距离都非常近。而最不自由的是个国家,相反的,在五个不同的地区。

当然,地域只是“自由”和“不自由”众多不同之处中的一个。我们的故事可以继续探讨这两个团体主要的不同方面,从国家政策到文化再到历史。一个关于差异的研究是很吸引人的。

下面我们来说一个相似的故事。它基于人类发展的三维图(健康长寿的生活,知识和较高的生活水平)比较了世界上所有国家的性别差距。这个图表的一端的国家都差距较大,而另一端的却基本平等。

探究交叉点

当相交的数据中有两条不同的线,并且一个超过另一个时,问题就产生了。这个有关自由的数据显示出“部分自由”国家的数量超过了“不自由”的国家,继而超过了“自由”的国家。是什么导致了这种变化?当排名发生变化时,人们就想知道原因。

自从破窗政策在1993年起作用之后,纽约时报的Sarah ryley将纽约发行传票的数量可视化。起初它的数量急剧上升,并且在开始缓慢下降之前一直保持平稳。然后盘查数量的飙升导致了它在2010年与传票数量的一个交叉点。就算这样,这两条线也没有进行比较。然而,这个交叉点和它的组成部分可以书写一个有关纽约执法策略的故事。

剖析原因

有时候一些原因集中到一起就像是一个迷,形成了一个大局。它们可能是加法或乘法的关系。比如,每个国家的自由程度得分都是法律、经济和政治自由的总和。

这里有一个图表体现了太阳是怎样控制天气的。这个可视化绘制了从太阳黑子到全球天气的一些点,强调了它们之间的因果关系。

描绘出异常值

我们被那些不同于其他的事物所吸引。我们想要知道这些异常值背后隐藏的原因和原理。

发现这些异常值有时是需要一些数据研究的。将这些有关自由的数据可视化为分散点图,你可能会说这里边没有异常值。但是将它们根据区域分解成盒图,你就可以发现它们是分离的。

这个图体现了在2013年上半年各政府对facebook的需求数量。它清楚的显示了美国以8200多的需求数量优势成为了一个明显的异常值。一个伴随而来的故事可以点明美国政府在社会媒体监测上的立场,主要是用事例和可能的原因来解释美国联邦调查局不同寻常的高数量的需求。

原文发布于微信公众号 - 钱塘大数据(qtbigdata)

原文发表时间:2017-10-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

AI 预测人脸“第一印象”: 为没有真实数据,只有可衡量行为的问题建模

【新智元导读】美国圣母大学、哈佛大学等研究人员挑战为没有真实数据,只有可衡量行为的问题建模,他们设计了设计了一个基于回归框架的卷积神经网络,纯粹基于视觉判断得出...

3249
来自专栏机器学习算法与Python学习

谷歌打造自己的机器学习大军

作为机器学习的一种,打败了李世石的AlphaGo让更多的人认识了“深度学习”。 ? 作为机器学习的一种,打败了李世石的AlphaGo让更多的人认识了“深度学习”...

2669
来自专栏机器人网

机器学习不是要取代工作,而是重新设计工作

围绕人工智能和自动化的争论似乎一直都是悲观主义者占主导,他们担心机器人会取代所有的工作,而乐观主义者则不以为然。但麻省理工学院Sloan教授Erik Brynj...

592
来自专栏大数据文摘

地平线余凯:自动驾驶处理器的“三国时代”| 清华人工智能研习社

1544
来自专栏量子位

吴恩达新公司曝光:签下富士康,要用AI变革制造业

夏乙 发自 凹非寺 量子位 出品 | 公众号 QbitAI ? 一切都在吴恩达的计划之中。 这个月初,吴恩达现身乌镇世界互联网大会,同时透露了一个重要进展:几周...

3555
来自专栏大数据文摘

沈浩:新媒体时代,数据新闻需要什么样的人才?

2426
来自专栏机器之心

现场 | NIPS举办了第一场记者发布会:请媒体警惕这波AI热潮

机器之心原创 作者:Tony Peng 面对记者,NIPS 大会传达了很明确的信息——请不要妖魔化机器学习。 今年落户长滩的 NIPS(神经信息处理系统进展大会...

3248
来自专栏企鹅号快讯

什么是人工智能,生活中有哪些应用是人工智能,能实现什么功能?

在很长一段时间内,我们对于人工智能的印象和认识都来源于科幻电影,每当提起人工智能,我们的大脑总会浮现出未来感,科技感的画面或者词语。但是短短几十年的风云际会,当...

2917
来自专栏人工智能头条

CCAI讲师专访 | Toby Walsh:用AI提高器官移植的成功率

763
来自专栏新智元

【深度】机器的崛起:算法会超出我们的控制吗?

【新智元导读】计算机科学尤其是 AI 的深层次应用已经开始干扰我们的生活,我们必须开始考虑在“机器智能”的应用过程中的两个问题:谁来负责?如何监管?英国政府首席...

3317

扫码关注云+社区