前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >展现数据之美

展现数据之美

作者头像
大数据文摘
发布2018-05-23 15:12:26
6670
发布2018-05-23 15:12:26
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘编纂作品

主 编:康欣

副主编: Linda Bi

欢迎熟悉外语(含各种“小语种”)的朋友,加入大数据文摘翻译志愿者团队,分别回复“翻译”和“志愿者”可了解更详细信息。

继“医疗大数据专栏”成立后,“数据可视化专栏”今日成立!

大数据时代正在奔涌而来。在这个时代,数据,渗入到我们生活的每一个毛孔:购物、出行、饮食、娱乐、美容、求职、医疗、健身、婚恋、耕种、防洪、生产制造等等,不一而足。甚至是睡着了,你还在产生着数据。面对每天产生的数以 T 计的数据,你是否做好了准备?你是否了解如何去“看”这些数据?你是否了解如何去“讲”这些数据?你是否知道如何让数据“舞蹈”和“歌唱”?在这里,盛情邀请你与我们一起,来到这大数据的世界,观看数据的美妙绽放,讲述数据的奇美故事,学会让数据为你翩翩起舞、引吭歌唱! 如果您是专业人员,愿意与大家分享,请加入我们,我们一起把这个平台和专栏做得更好。

今天,为您奉上“数据之美”。

图片文字不够过瘾?流量土豪要任性?就请来享受酣畅的视频,品味“活着”的数据。淌若流量小羞涩,备有图文摘要,供欣赏。

Anyway, come on guys!

可视化之美

演讲者:David MacCandless

我们好像总是被超负荷的信息和过多的数据折磨。好消息是也许我们能有种办法解决这个问题,那就是更多的用我们的眼睛。把信息视觉化,我们就能看出其中的规律和联系然后再设计这些信息,让它更能有意义,或者让它来说明一个故事,或者让我们能只关注那些重要的信息。如果不能做到这一点,至少视觉化的信息看起来特别酷.让我们来看看。

这是十亿美元图,我在看到媒体的十亿美元的报道时很沮丧,于是我就画了这幅图。

如果没有上下文的话,这些数字看起来毫无意义,所以了解它的唯一方法是将其视觉化。我从不同的信息渠道,收集了很多报道的数据,然后根据数量画出了这些方框。这里颜色代表钱的用途.紫色代表战争,红色代表捐助,绿色代表暴利。你马上就能发现,这些数字跟你有了直接的联系。你可以真正的看到他们了。

这是”鼹鼠丘”之外的一座山(Mountainout of Molehills 有小题大作的意思),是全球媒体恐慌时间图。这里粉色代表猪流感,黄色代表禽流感,淡棕色代表非典,绿色代表小行星碰撞,蓝色代表杀人蜂。

这些数据隐藏着一个有趣而又奇怪的规律,你只能通过数据可视化看出这些规律。看这条线(指着红色区域),这是暴力视频游戏的“景象”.每年都有两个孪生峰,而且每年出现的时间是一样的。为什么?十一月,圣诞视频游戏上市,很可能引起关于其内容的恐慌。但四月对视频游戏而言并不是个特别的月份。为什么会是四月呢?其实,1999年的四月发生了哥伦比亚枪击案。另外,这里还有一个规律。看到图中的那个缺口了吗?看到它是什么时候开始的吗?2001年9月(911事件),那个月里发生了一件真的很令人恐惧的事情。

信息界大牛Lee Byron和我搜集了一万个Facebook的更新状态,寻找包括"分手"和"分手了"的短语。这张图是我们找到的规律--人们在春假期间"清理"关系,愚人节和周一是分手高峰期,一个暑假都保持着单身。当然一年中分手最少的一天是---圣诞。

这是丹麦物理学家Tor Norretranders的杰作,他把感观的带宽转化成了电脑术语。你的视觉是最快的,它有和电脑网络一样的带宽。你还有触觉,它有和USB接口一样的速度。你的听觉和嗅觉,有和硬盘一样的处理速度。你还有可怜的老化的味觉,它仅仅只有袖珍计算器那样的处理速度。角落里小小的(白色的)正方形,占微乎其微的0.7%的比例,这是我们真正能感知的部分。

这里两张图,上面一幅是关于几个国家军事预算金额的,很显然美国的军事预算最高。但真的是美国军事预算最高吗?我们再来看第二张图。总所周知,美国的国民生产总值极高,当我们把这一数据引入军事预算图表中时,再来看看哪个国家的军队预算占国民生产总值比例最高呢?这大大的改变的原来的图象。其它你很可能没想到的国家一下子出现了,美国跌入了第八位。

哪个国家士兵最多?毫无疑问,一定是中国。但不可否认,中国有巨大的人口,如果我们做跟军事预算同样的处理,我们又看到一个彻底不同的图象。原本位居第四位的韩国在每十万人口士兵数的排名中跃居到了第一位,而中国则落到了124位。

我喜欢吃一些保养品来保持健康,但我从来不能用证据证明这些东西是不是真的有用,因为总是会有相当矛盾的证据。这里把所有这些关于营养补品的证据都视觉化了。这样的图表叫作热气球竞赛,图上越高的地方,关于这些补品的证据越多的。这些气泡的大小对应于GOOGLE上这种补品的受欢迎程度,这样你就能马上领会效力和受欢迎程度间的关系。同时,如果你把证据分级别的话,画出一条“值得”线。在这条线以上的补品是值得投资的,这条线以下的补品,就很可能不太值得投资了。

(编者注:在视频中,你会看到热气球竞争图的细节,还有动态的热气球竞争。)

这是一个将政治光谱视觉化的图像,我试图用它来理解政治意识形态是如果工作的,想法是怎么从政府开始向下渗透到社会,文化,再传递到家庭、个人以及他们的信念中,又如何再反过来影响上层形成一个循环的。关于这幅图,我喜欢的是它是由概念组成的,它开拓了我们的世界观并且帮助我们看清别人是怎么想的,了解他们的想法是从哪里来的。(注:视频中,你会看到不同政党的特点,以及一幅图如何让作者改变了对某政党的理解。)

哪一个喷发出了最多的二氧化碳?是飞机还是火山,还是那些严禁起飞的飞机?让我们来看一下。看着这些数据,我们发现,火山喷发出了十五万吨二氧化碳;那些禁止起飞的飞机如果飞起来的话,将喷发出三十四万五千吨。

简单总结一下。

信息设计其实是在解决信息上的问题并且给出一个精美的解决办法。现在,我们社会里有很多信息方面的问题,从过饱和的数据,到信任和可靠性的缺失,以及逃避、怀疑和缺乏透明度。视觉化信息能给我们一种快速的方法来解决这些问题。即使是在信息很糟的情况下,视觉上依然可以做得相当漂亮,因而我们可以非常迅速的理清思路或得到一个问题的答案。

【编辑简介】

说明:有意联系译者的朋友,请给“大数据文摘”后台留言,附自我介绍及微信ID,谢谢。

Linda Bi:现居芝加哥,数学专业精算方向硕士,对保险和金融领域的数据分析工作很感兴趣。有两年多的产品分析经验,主要负责数据库管理和统计分析工作,并向公司管理层提供产品性能改进建议。

希望通过大数据文摘这个平台,向大家介绍相关领域的高品质文章,同时也希望了解更多国内大数据和保险金融行业相关的信息,和保险金融行业从事数据分析工作的专业人士有更多的交流。希望交流的朋友,请后台留言并留下微信号,谢谢!

康欣:博士,多年从事图像及数据处理和分析、计算机视觉、模式识别、机器学习、增强现实等领域的技术研究和创新应用,现为西门子中国研究院高级研究员。愿借此平台,与大数据分析的爱好者以及专家学者交流。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-02-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档