用数据讲故事的诀窍 ——创建有说服力图表的5个步骤

iCDO互联网数据官

发布于 2018-03-02 17:19:57

1.5K0

文章被收录于专栏：互联网数据官iCDO互联网数据官iCDO

用数据说话是当今社会的一个特别流行的词，它反映了当今人类面对这个信息爆炸时代所需要做出的必然的改变。

有预测截至2020年，整个数字世界的数据量将达到44ZB，或者是44万亿GB，这个量级是2013年数据量的10倍。

也许你无法理解这个数字到底代表什么意思，举例来说如果我们按这个数据规模依次存入平板电脑，需要的平板电脑数量叠起高度是地球到月球距离的6.5倍！

毫无疑问，通过讲故事的方式来让人们理解那些毫无意义的数字是未来必备的技能。我们将生活在一个数字的世界中，但是讲故事仍然是我们去理解我们所生活的世界的一个重要工具。

遗憾的是，很多人都很害怕使用数字，他们宁愿沉迷于舞文弄墨，只是偶尔利用一些统计数据去支持他们的观点。但在现在这个数据开放的时代，连最不喜欢数学的记者都能熟练地使用大规模数据进行报道了，你也得学习这种能力了。

如果你决心在这个美丽新世界中开始你的冒险之旅，那么让我们来学习一下如何利用数据来讲故事和怎样避开常见的错误。

好的数据可视化设计背后的科学原理

人类视觉感知的错觉

理解人类视觉感知的工作过程，是创立有效而有说服力的数据可视化报告的首要条件。

与我们在高中学习到的相反，视觉处理的过程远远复杂于一台数码摄像机的工作原理，我们的眼睛就像摄像头，我们的视神经就像电缆，而我们的大脑就像一个处理器和硬盘驱动器。

Alberto Cairo在他的《The FunctionalArt》（https://www.amazon.com/Functional-Art-introduction-information-visualization/dp/0321834739）书中深入的探究了人类感知的机制，并解释了视错觉在我们观察这个世界时是如何扮演一个重要的角色的。

举例来说，当我们注视眼前的屏幕时，我们以为我们看到了在人类180度可视范围中的所有物体，但是实际上我们真正看清楚的只有在我们正前方2度视角范围内的物体。

可什么我们并不觉得眼前的事物都是一大片的模糊？

这受益于人类眼睛快速移动的扫视效应，通过扫视我们的眼睛可以快速遍历整个场景并将收集到的信息汇聚成为合成图像，这使我们更容易相信人类的眼睛像是一个180度透镜，但这是个错觉。

我们认为自己就看到的场景正如左侧这幅图展示的一样，但实际上我们的眼睛做的更像是右侧多图中展示的：在整个场景的各个点上快速抓取快照。

那么这将如何影响我们去更有效的传递信息呢？实际上注意到人眼注视某一场景时是有优先级的而非随机投射的视野中的各个位置这一点，对我们有效的抓住受众的注意力去有效的传递信息非常有用。人眼通常会先检测所观察场景的基本特征并将关注的重点聚焦在那些格外引人注目的物体上，比如：移动的物体、有明亮颜色的色块、与众不同的形状等。

前注意属性（PreattentiveAttributes）

这些基本特征也叫“前注意属性”：在我们真正意识到他之前，我们的大脑已经在对这些内容进行处理。比如：当我们注视上面那张图（就是木头通到那个）时，我们的大脑首先检测到前景与背景的不同，他可以迅速发现图中通道的起止，以及周围树木的起止等等。与周围其他元素的对比越强烈我们的大脑就越容易把他区分出来。

因为大脑的这个特性，对比最后一张图我们可以在下图的前两张中更容易的找到“熊”。

因为我们的大脑在区分事物时对颜色比形状更敏感，所以我们在设计数据可视化时最好可以刻意利用颜色及明暗的变化来将受众的注意力吸引到某些关键信息上。

为了节省时间，人类的大脑通常会将相似的物体归集并快速识别出那些不同的物体。试看下图，我们可以不经任何思考快速找到图中的不同元素。

毫无疑问，在做数据可视化设计时，对“前注意属性”的把握可以成为设计者创作更加有效、有说服力的可视化作品的最重要的工具。

至此，我们已经对人类感知背后的科学原理有了初步了解，下面我们就更加深入的探讨一下利用数据来讲故事的实际过程和方法。

第一步：抑制马上选择图表的冲动

对于大多数人而言，创建图表的过程几乎是出于本能，选择好需要展示的行与列，在Excel中选择某一个图表选项点击一下——大功告成。

但是如果你不想简单的展示信息，而是想通过数据来讲故事，那么你可能需要更多的步骤。

Harvard BusinessReview出版的 Good Charts（https://www.amazon.com/dp/B01BO6QM9Q/ref=dp-kindle-redirect?_encoding=UTF8&btkr=1）这本书中建议要抑制马上选择图表的冲动，并在选择图表前问自己两个问题：

1. 需要展示的信息是数据驱动的还是概念性的？

2. 展示的目的是陈述还是探索？

当你回答了这两个问题，就可以进一步划分出他在下图四个象限中的位置，从而找到更好的方式来实现可视化。

如果结果落于左上角的象限，那你最好利用图表和插图来简化你的表述。通常山峰、金字塔等含有一定隐喻的图像会被用于此类展示，与文化习俗相关的层级图和符号也能达到相似的效果。

如果结果落于左下角的象限，那目的则变成通过概念性的展示来拓展出一个可供探索的话题。这通常被用于白板讨论的场景，在此场景下你通常是想规划一套业务流程或构造一个系统而无需使用具体的数据。

与之相反，位于右下角所在象限的第三类可视化需求比其他类型都更复杂。你可能需要处理多种海量数据集，并且可能需要与一位数据科学家一起共同设计完成一种交互式的可视化方法，用以揭示相关的（静态）模式与（动态）趋势。

位于右上角所在象限的最后一类需求则包含了柱状图、折线图、散列图等通用可视化方法。

作上述分析的目的是确认或提出可视化设计时需要关注的语境（或表述环境），以帮助我们可以聚焦在如何找到简洁的叙述方式，并通过有效的设计使受众可以充分理解我们所要表达的一个明确的观点。

对于上面提到的每一种可视化类型，我们也许都需要花若干小时去分析，本文会专注在陈述性可视化的相关类型上，也就是上述4象限图的上半部分。

第二步：在开始设计前充分探寻相关语境（表述环境）

另一个经常被忽略的步骤是花一点时间去研究可视化作品所面临的相关语境。

例如：听众是谁？你越了解你的听众，了解他们的需求和面临的挑战，你就越容易找到可以引起共鸣的话题。

同样重要的还有：问自己需要通过这个展示让受众了解什么？做什么？需要他们做出某个决定？还是引发就某一话题的讨论？

再有，就是以何种方式展示？通过一次现场演讲（这样更有效的控制信息展示的方式）？还是通过打印出的文件（此情况下，则完全通过读者自身来控制阅读的快慢和钻研的深浅）？

以上所有反馈对我们回答最后一个问题都很重要，这个问题就是：你如何利用你的数据来打动受众。这将带我们进入下一个重点

第三步：定义图表的焦点和你想讲的故事

无论通过书写、信息可视化还是图表设计，有效沟通的关键是细细打磨所要表述的首要信息。

在Storytelling With Data（https://www.amazon.com/dp/B016DHQSM2/ref=dp-kindle-redirect?_encoding=UTF8&btkr=1）这篇文章中，ColeNussbaumer Knaflic讨论了把需要表达的信息归结为“so what”方式陈述的需求。这其实比听上去更难。为了更容易做到，你可以试着在3分钟之内把你想表达的信息表述给一个对相关数据并不熟悉的朋友或同事。然后，在进一步尝试把他浓缩到一句话中。

Resonate的作者Nancy Duarte指出，这句话必须包含三个元素：

1. 它必须表述出你的独特观点；

2. 它必须明确其重要性（听众为什么要关心它）；

3. 它必须是一个完整的句子。

一个典型的“so what”的句子举例如下：我们的软件可以让你只用不到传统图形设计工具一半的时间就完成可视化内容的创建，它可以大大节省DIY设计者的时间和资源。

第四步：利用马克笔、铅笔和纸来串联你的思路

在你打开PowerPoint或其他桌面应用前，尝试用不同颜色的马克笔和纸来串联你的思路。首先，先尝试匹配上文涉及问题（如：关于语境的问题、图标类型选择等）答案中的关键字，可参照下图来归纳。