Tableau 数据可视化:拖拉拽看看 资本巨头都干了些什么

作者: 黄斐

经常有人问我Tableau可以做什么,简单来说:

1. 拖拉拽就实现数据可视化,但同时能满足高阶需求

它跟excel的透视表类似,只需要把维度拖拉拽到面板,不需要代码,甚至还会自动帮你决定用条形图、气泡图还是箱线图。傻瓜式入门的同时,它有很多高阶功能,快速表计算、参数、LOD等功能基本能满足所有数据展示需求,还能跟R集成、调用函数和模型。

2. 好看

这不太好证明,但我印象很深,Tableau创始人Christian Chabot、Chris Stole和Pat Hanrahan,他们背景分别是风险投资人、计算机博士和奥斯卡视效专家,Hanrahan研发的渲染技术在《指环王》和《哈利·波特》里都有所运用。大概这就决定了Tableau除了擅长数据分析和功能能丰富之外,另一个重要基因是视觉效果。版面、配色、甚至字体,都会考虑数据可视化的需求来设计。

3. 交互和探索

这是tableau最迷人的地方,它不只是一个二维的图表,通过交互可以查看不同层次和维度。它鼓励读数据的人自主探索,可以从总体看到规模趋势、也可以不断下钻看到细节。类比用户研究,相当于除了定量数据,你还能做定性研究,看到每个具体用户的信息和真实的声音。 记住它擅长的事,如果你再拿它来做静态的条形图,那它真的只能是个很贵又很难用的EXCEL。

下面分享一个案例,是今年我在tableau viz 可视化比赛的作品。请看链接:https://public.tableau.com/profile/fei.huang#!/vizhome/TableauViz_sh_final_Feihuang/1

数据是一些投资机构(包括IDG、红杉资本、阿里、腾讯等)的投资数据。数据很简单,11列X1975行。示例如下:

*数据经Tableau方处理,回报率不代表真实回报率

Story-把数据串成一个故事

Teablau形式有worksheet, dashboard, story。worksheet相当于单个的图表,dashboard把多个worksheet拼成一个页面,而story就把多页数据串成一个故事。

现场只有30分钟完成作品,需要呈现故事性,所以我做了个5页的strory。

page1"感受投资风潮" ——“页面”功能实现时间轴动态

这一页只是引入,让观众感受下十年间投资的变化,展示总体趋势。图中每个圆点是一次投资,圆圈大小表示投资额,颜色深浅为时间先后,文字标注展示投资机构和投资对象的名字,每个圆圈鼠标上移有具体每个项目的信息, "页面“可以选择时间,也可以动态播放。

1999~2016的16年期间,这10家机构在各地投资1974个项目,总金额超过2000亿元。

TIPS: 永远记得你的屏幕是个平面,横竖就真的只能展示二维,每增加一个数据维度,就需要在图上增加一种能量化的元素, 比如颜色、圆圈大小。当然对时间数据,还有一个利器是动态图。元素越多、图就越难理解,一定要根据展示意图有所取舍。

page2 "看清投资风向" ——“效果”功能实现两个图表之间的联动

这一页的上图是投资金额在各机构的分布随时间的变化,每个颜色代表一家投资机构。早期是IDG、红杉等专业投资机构为主,2008年会后腾讯和阿里开始入局,在2012年前后逐渐成为投资巨头。

下图展示的是投资的行业分布,每个颜色为一个行业、每个小格子为一个投资对象,通过筛选器选择时间。早期投资对象为房产、旅游业,后期投资行业越来越多,涉及各个领域,在2016年投资行业第一名为金融业,第一名是京东金融、融资66亿。

这图最妙的地方是在鼠标指到上图的某个时间、某个投资机构,下面的图会展示该机构在那个时间的投资行业和对象分布。你会看到腾讯2008年还只投资游戏和广告,2015年它投资涉及16个行业,项目数都数不过来。

TIPS: 每个读者关注的角度可能不一样,比如我会对腾讯的投资感兴趣,阿里的读者可能关注阿里的,因此允许用户自由探索,可以让不同的人关注到不一样的细节。

page3"评估投资及回报"——箱线图+散点,展示个体和整体的水平

这个图比较简单,左图放的是整体的投资金额和回报率曲线。平均投资金额在14年后暴增,平均回报率则基本稳定在0.5。

右图放的是不同轮次的投资金额和回报率变化,投资金额从种子轮到A/B/C/D/E轮融资金额越来越大,但在每一个阶段都可能得到从0到1的投资回报率。也可以看到,并购类的回报率整体偏高,战略投资金额很高、但回报率不高。

除了箱线图展示各轮次的整体水平,每个散点都展示了一个具体项目,鼠标上移到具体的点,就能看到超出平均水平的这些点,具体都是什么项目。

TIPS: 投资金额和回报率跟什么东西有关?有些人会试图强制找到规律,做个回归曲线之类的,但这数据连续变量只有金额和回报率,他两之间并不是正相关关系,再加上极值很多、即使有模型也并不适用。通过桌面研究和整理数据后来发现,金额最重要的变量是投资轮次,而回报率,没有规律就是最大的规律。

page4 “探索优质项目”——聚类分析产生新变量

这一页比较复杂,首先左上角的图,根据投资金额和回报率,把所有项目通过tableau内置的聚类算法分成6类,直观的看到:高投资金额分为高回报和低回报,低投资金额分为低、中低、中高、高回报。

项目分为六类后,右上角图展示的是各家投资机构六类项目的分布,看到高投资项目主要是阿里、腾讯、红杉,而低投资的项目,除了光源资本,各家都有低、中低、中高、高回报项目,只是比例略有不同。

下图则展示的是所有投资项目获得的投资的轮次、以及每一次融资的详情,这时候这个图几乎已经把所有的数据都展示出来了。用LOD功能计算每个项目的投资轮次、按轮次排序。

同样它可以跟上面两个图做联动。比如选择一个高投资、低回报的一次投资,投资对象是美团,可以看到美团在A B 轮时主要是低/中低回报的,C轮是低投资高回报,E轮则进入高投资阶段,投资他的机构有每轮都参与的红杉,以及腾讯和阿里巴巴。

TIPS:tableau的“提示框”,可以把所有相关的明细信息都放进去,鼠标上移的时候,就能马上看到详细的信息。

page5“end”——展示每一个数据点

这一页只是个结尾页,没有很多信息,上面每一个点展示的是一次投资,颜色表示行业、大小表示投资额。

你是不是想投诉我图片都看不清,看不清————说明tableau做的事情不是图片能解决的~

请再看一次tableau public链接:https://public.tableau.com/profile/fei.huang#!/vizhome/TableauViz_sh_final_Feihuang/1

本文仅代

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

2017年最值得关注的人工智能概念之“迁移学习”

【新智元导读】 微软全球资深副总裁 Peter Lee 认为,迁移学习同样具有极高的应用潜力。过去,机器学习在搜索和信息检索等领域中的实用价值较为单一,大多聚焦...

32712
来自专栏量子位

年薪百万的机器学习专家,为什么不产生价值?

本文转载自第四范式知乎专栏,量子位已获得授权。 ? 「范式大学系列课程」第 3 篇文章: 年薪百万的机器学习专家,为什么不产生价值? Part 1 一个朋友的企...

3396
来自专栏大数据挖掘DT机器学习

想学习R语言却不知道如何学习,应该按何种步骤?

问题: 背景金融小硕,想学习R语言却不知道应该如何学习,应该按何种步骤,看哪些书或者视频资料等东西,所以提问这个问题,希望知道学习R语言的一般过程是怎样的,...

3324
来自专栏互扯程序

谷歌AI版“你画我猜”背后是什么样的原理?

我们先看看这个小程序是什么,打开微信小程序搜索页面,搜索“猜画小歌”,打开这个小程序,点击开始作画。小程序会先出题,告诉你画什么,20秒倒计时,你画完内容,然后...

452
来自专栏专知

看论文头疼吗?这里有一份学术论文阅读指南请查收~

【导读】对于从事学术研究的人来说,跟进最新的论文是必备的科研素质之一。但面对海量的论文更新,应该如何快速又有效地阅读论文,吸收其精华? KyleM Shanno...

1190
来自专栏理论坞

日韩系风格卡牌示范教程《千叶真琴》

在时下流行的卡牌插画中,有一种卡牌凭借着时尚、清新、靓丽的画面风格倍受年轻人的喜爱,这就是日韩系风格卡牌。它们的代表就是Applibot公司旗下的《不良道》。游...

752
来自专栏钱塘大数据

超实用!四个方法帮你搞定数据可视化界面设计(附神器)

“仪表板”、“大数据”、“数据可视化”、“数据分析”——越来越多人和企业,开始运用他们的数据来做一些有趣的事情。在我的职业生涯中,有幸参与一大批数据为重的界面设...

3374
来自专栏CreateAMind

X君与C君关于空间智能重构与通用学习机的对话(之二)

文章中观点:在动物来说,记忆和分析是不可分的,是一体的。现在的无人驾驶的记忆就不行。高精度地图那不是记忆。

1073
来自专栏大数据文摘

嘿,听说你不喜欢数学?

1315
来自专栏新智元

谁说AI没想象力?DeepMind破解灾难性遗忘密码,让AI也有记忆

暑假结束回到学校时,你可能会觉得前一年学过的东西已经统统忘光了。但如果你像人工智能系统那样学习,你会真的忘光光——当你第一天在课堂上坐下来时,你的大脑会把这当作...

603

扫码关注云+社区