图表到底应该“简单“一些还是“复杂”一些???

这个话题,其实很早就应该写一写了。

因为这个主题在数据可视化中的地位差不多相当于当今哲学至于社会科学的地位。

说白了就是涉及到数据可视化理念之争,涉及到可视化使用场景、目标与定位的问题,也意味着这是一个纷争不断、没有定论的话题。

所以这个问题话题很棘手,所以长久以来我一直在回避这个问题,想着等自己对数据可视化的理解更为深入、全面之后,再做决断。

---------

可是最近发现了之前推送过的几个信息图里,出现了很多关于图表是不是做的太复杂了的评论,甚至有些带着质疑和讥讽的口吻直接否定了我所做图表的价值。

看的我实在好气啊,就借这个机会跟大家聊一聊关于图表的“简单”与“复杂”吧。

这里首先亮明我自己的观点,我是一个实用主义者,并不主张利用炫酷、夸张、复杂的图表来呈现业务数据,图表简洁清晰、数据表达准确、配色协调融洽即是良好的数据可视化呈现形式(仅针对普通的业务分析场合)。

关于实用数据图表的分类:

通过长期的图表模仿、观察和练习,我把我们平时看到的图表大致分为三类:(仅就商务场合使用而言)

财经新闻类数据图表:(兼具设计感与逻辑表达)

这类图表因为需要作为纸质出版物在市场进行流通,需要考虑的因素很多(配色、字体、版式、处理色差甚至需要对色忙者友好),在配色和版式设计上都很讲究。

这些图表以《经济学人》、《华尔街日报》、《商业周刊》、贝恩、麦肯锡、罗兰贝格、波士顿为代表。

这些图表之所以这么讲究,一方面因为纸质出版物需要,另一方面因为服务客户相对高端,审美需求决定,同时这些杂志和咨询公司所做的工作通常都是高附加值,简短的一份咨询报告、一期商业杂志,动辄百万;其中图表使用结合文字的语境,相互配合,恰到好处,惜图如金。

附加值这么高的工作,当然可以配置专业的设计师和图表设计咨询来专门处理图表的配色、版式设计、字体搭配等细节问题。

投行咨询类数据图表:(注重逻辑感和简洁性)

这类报告以四大咨询、IBM、投行为主,因为行业报告和类似的咨询服务需要很多的数据支撑(特别是做宏观研究或者涉及到金融市场时),几乎是达到了图文相当的比例,时间序列的图表说实话很难美化,更别考虑设计感了。

图表多、任务重、美化难,这些因素都决定行研与咨询类图表不能照着财经新闻的路子来,只能在数据表达准确无误、逻辑通畅的情况下,尽可能的提高效率,所以很多时候谈不上美,但也算不得丑,就是有一点儿性冷淡风。

所以这些图表大多是逻辑导向性,形式非常简洁,没有太多美化,一切以信息表达为主,不做过分修饰。因为这些图表的受众一般多以分析师和决策者为主。他们需要在最短的时间内,通过图表获取尽可能多的准确信息进而为制定决策提供依据,至于设计感嘛,那是锦上添花的事情。

垂直行业咨询类数据图表:

以国内的零点咨询、易观国际、艾瑞咨询等为代表,这些垂直类咨询公司,平时需要涉及到大量的分析报告数据垂直行业研究报告。

其中涉及到需要数据图表表达得任务量也很大,但是这些咨询类公司在制作市场报告时比较注重自己的品牌,所以可视化报告的主题色一般都会跟自己企业VI系统保持一致,即整份报告都会保持一致的配色系统和版式风格,质量谈不上上乘(跟第一类比起来),但也算是中规中矩,而且通常很多传播渠道上网络比例较高,配色较为高亮。

数据新闻类可视化图表:

数据新闻这个概念,可能在国外火的比较早,想华尔街日表、经济学人都会在一些大事件发生后进行专题报道,通过将数据信息呈现在一幅由设计师专门加工过的版面上,来达到系统化呈现数据的目的。

国内的话,主要代表有网易数读、搜狐数字之道、一财等。

这种图门槛较高,因为无固定形式,设计主导,变换莫测,通常会用到专门的涉及工具,如PS、AI等。

这四种图表形式我都有过涉猎,我的感受是,每一种形式下的图表选择都是依据各自的应用场景和资源匹配状况作出的最佳选择。没有什么一个形式通吃的情况,就像是外出旅行,入乡随俗。到了谁的底盘就乖乖的按照人家的套路来,免得引起不适。

数据可视化作为一个数据分析、设计、计算机图形学等诸多领域的交叉学科,我们日常所用到的业务数据图表,仅仅算是极小的一块相关内容,千万不要试图以偏概全,觉得随便画个图就算是精通数据可视化了。(对于数据可视化而言,我也是个没有摸着门道、正在苦苦寻觅的前行者)。

当然,好的图表、坏的图表、简单的图表、复杂的图表,这些原则还是应该加以区分,至少不能在大方向上与数据可视化的理念背道而驰。

不深究学术概念,我所理解的数据可视化就是把数字(文字)信息通过一套可视化元素编码(或者映射关系),映射为我们视觉上更加友好的可视对象,比如点、线、面、颜色、以及点线面和颜色的组合。

这种映射关系,实际上将我们获取信息的方式从理性脑(左脑)的“关注”转换为感性脑(右脑)“感受”,通常意义上所说的字不如表、表不如图,其实是就是基于人类视觉对于外界信号的接受程度以及人类大脑左右脑分工上来进行解释的。

8小时工作时间内,大部分人实在使用左脑进行理性思维工作,难得有时间看到图表,左脑才能休息一下,右脑得感性闹=脑此此时才处于激活状态。

这些元素以及元素的组合依据各自在数据呈现上的难易程度,分别用来表达数据量级信息、分类信息等。

(比如线条的类型无法呈现量级大小只能呈现类别,点的大小只能呈现数据量级大小不适合用于呈现类别资料,渐变的颜色可以用于表达数据量级,色相的类别可以用于呈现类别数据等)。

所以我们的现在要解决的问题是,在制作日常使用的图表过程中,首先不能犯基于视觉可视化呈现理念上的错误(因为这是会降低人类大脑和视觉接受信息的效率等)。

基于此,在符合这些规则理念的基础上,做出来的图表才是有信息价值、有意义的图表。

(尽管我知道很多作图的时候要么基于个人喜好、要么基于领导喜好,要么直接不管不问的去网上扒模板)。

其实以上我所说到的四大类图表(也许我概括的不够全面,欢迎补充),只要是遵守了这些视觉编码的规则和建议,都不算坏的可视化表达形式,至少都及格了。

(当然第一类图表在设计上更加友好,形式上又不复杂,所有大多数人都喜欢,第四类图表看着很花哨,很多人由于缺乏专业的可视化训练,不太能接受这种类型)。

我不主张刻意的通过形式复杂化来装饰图表。

但是有一点值得注意的是,如果是制作过程的复杂促成的理解上的简单化,这是一个提升系统化信息呈现能力的重要途径。但是这种方式需要专业的人去做,需要配备专门的技术人员去实现。(第四类图表)。

我看到过很多人在一个图表中使用图例分类来呈现10几个分类的第二维度,我给出的建议是使用一个分面来使得每一个类别的趋势或者结构更加清晰,但是得到的回复是那样太复杂了了,这样看着简单(真的看着简单吗)。

我想提醒大家的是,要分清楚图表的两个“复杂”概念,他是一个二维的复杂度矩阵:

过程的复杂化

信息呈现的复杂化

通常我们会选择将过程简单化(Excel是不会考虑你的第二维度有几个类别的,它只管出图,实质上是将可视化得过程简单化了),但是很多时候却造成了信息呈现的复杂化(十几个分类,鬼才能分得清楚,竟然还试图使用颜色渐变来区分,你以为人人都是像素眼)。

当然如果能兼顾两个复杂度的话,那是最好的,第一类图表确实做到了。(人家不差钱呀,你有这个资源吗)

所以通常我们只能顾得其一,那我建议有条件的话,可以让过程复杂一些,让结果理解起来简单一些。

最不济,结果复杂了,制作过程相对简单(这是很多时候遇到的问题,但是鉴于人力物力投入成本,也只能忍了)。

如果你成功做到了过程的复杂化和结果的复杂化,那么贡献你,你赢了。

以上第四类图表(信息图),就是试图通过过程的复杂化来达到信息呈现的简单化(这样也有很大的风险,如果乱了规则,那么就是过程和结果都变得复杂了)

--------------------

这里打个比方,乔布斯得苹果手机看起来很精致(但是它背后得过程无论软硬件都是使用全球顶尖得设计师和工程师来完成的,复杂度可想而知,为的是将作品得外观和使用体验做到极致,然而我们发现极致之后我们只能看到极简得外观却无从得知复杂得过程,我觉得作图也是这样,呈现给别人得是信息传递上的简单化,而背后隐藏的是制作过程得复杂化,但是大家得关注点一定要找准,你所说得复杂都到底体现在哪儿)。

-------------------

我之前确实使用R语言和Excel模仿了挺多类似高难度的信息图,然后很多读者开始吐槽我作图的图表已经失去了可视化的意义,复杂的让人不能理解。

其中争议最大是这几个:

那么我想反问一句,你真的认真读图了吗,你真的确定你做出来的所谓的简单的图表,有我做的这个所谓的复杂的图表更易于理解吗,你真的搞明白了过程的复杂化和信息呈现结果的复杂化的区别了吗,你真的搞明白这些图表的主体受众和使用场景了吗。

(我解释一下,这几幅图都来自于网易数读数据新闻栏目,使用场景是主题事件得数据新闻解析,一个图,涵盖所有主要数据信息,独立支撑一篇新闻事件,当然我使用R语言写写这些图表得代码并非有意让大家去模仿这些,仅仅是自己想到了使用编程构思这些图表得思路,分享给同样喜欢使用ggplot2来绘制高级信息图得读者,这样通过日积月累得训练之后,你会发现只要是你有了思路和想法,那么就可以不会受到技术手段的束缚,轻松使用刚ggplot2绘制所有你想要表达得数据信息,所以大家不要老把关注点放在图表简单还是复杂上来)。

对于那些评论,善意的建议和批评,我都会虚心的接受回复我自己的理解和解释,大家一起交流心得,非常开心。

对于那些看热闹不嫌事儿大的键盘侠(站在大师的制高点上满口讥讽嘲笑的),我只想说,我们来公开论一论道可以吗,免费提供了教程和代码,还得被XXX污染心情。

原文发布于微信公众号 - 数据小魔方(datamofang)

原文发表时间:2017-07-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

如何通过自学,成为数据挖掘“高手”

1. 读书《Introduction to Data Mining》,这本书很浅显易懂,没有复杂高深的公式,很合适入门的人。另外可以用这本书做参考《Data ...

1123
来自专栏逸鹏说道

一位从后台转向AI的独白

刚开始接触 AI 的时候会有这样的一些坑。第一个我把它叫做碎片化时间陷阱,大家一直以为碎片化可以学到很多东西,于是我也关注了一堆的AI 公众号,每天看一下公众号...

1463
来自专栏镁客网

全球AI泰斗Stuart Rusell:研究人工智能太诱人了,不可抗拒

1766
来自专栏CDA数据分析师

好书 | 《数据之美:一本书学会可视化设计》

书名:《数据之美:一本书学会可视化设计》 作者:邱南森(Nathan Yau) 出版社:中国人民大学出版社 ? 推荐理由 《经济学人》杂志2013年年度推荐的三...

2315
来自专栏大数据挖掘DT机器学习

"我们做的微博数据挖掘"

作者:数控小V http://www.36dsj.com/archives/48650 新浪微博在2012年-2013年红得发紫,也是移动互联网快速成长的年...

3735
来自专栏机器人网

哈佛大学研发新算法可定制柔性外骨骼的个性化控制策略

当外骨骼变得柔软时,比如哈佛大学Biodesign实验室设计的exosuit,穿戴者和机器人更需要同步。但每个人的移动方式有所不同,为个人用户定制机器人是一件非...

2834
来自专栏思影科技

脑磁图研究:大脑多时间尺度并行抽取声音信息

阿牛哥喊你来关注思影科技,做个scientist! 我们对声音的感觉总是连续和平滑的。听人说话,听音乐,在大街上听到各种周围的声音,我们感觉起来都好像流水连续...

3706
来自专栏Data Analysis & Viz

最全知乎专栏合集:编程、python、爬虫、数据分析、挖掘、ML、NLP、DL...

上一篇文章《爬取11088个知乎专栏,打破发现壁垒》 里提到,知乎官方没有搜素专栏的功能,于是我通过爬取几十万用户个人主页所专注的专栏从而获取到11088个知乎...

4182
来自专栏IT派

2017年大数据领域薪资有多高?

IT派 - {技术青年圈} 持续关注互联网、大数据、人工智能领域 互联网在经历前几年的繁荣之后,现在开始进入寒冬,资本家不再像以前那样大胆地投资,纷纷攥紧自己...

6494
来自专栏工科狗和生物喵

【我读《Big Data》】大数据时代的思维变革

正文之前 大数据是个很玄乎的东西,如果体系成熟,那么基本会波及到生活中的方方面面。只要能够获取数据,那么其他的过程基本只要算法模型得当,成本相当之低,但是如果能...

3796

扫码关注云+社区

领取腾讯云代金券