Tableau 数据可视化:拖拉拽看看 资本巨头都干了些什么

作者: 黄斐

经常有人问我Tableau可以做什么,简单来说:

1. 拖拉拽就实现数据可视化,但同时能满足高阶需求

它跟excel的透视表类似,只需要把维度拖拉拽到面板,不需要代码,甚至还会自动帮你决定用条形图、气泡图还是箱线图。傻瓜式入门的同时,它有很多高阶功能,快速表计算、参数、LOD等功能基本能满足所有数据展示需求,还能跟R集成、调用函数和模型。

2. 好看

这不太好证明,但我印象很深,Tableau创始人Christian Chabot、Chris Stole和Pat Hanrahan,他们背景分别是风险投资人、计算机博士和奥斯卡视效专家,Hanrahan研发的渲染技术在《指环王》和《哈利·波特》里都有所运用。大概这就决定了Tableau除了擅长数据分析和功能能丰富之外,另一个重要基因是视觉效果。版面、配色、甚至字体,都会考虑数据可视化的需求来设计。

3. 交互和探索

这是tableau最迷人的地方,它不只是一个二维的图表,通过交互可以查看不同层次和维度。它鼓励读数据的人自主探索,可以从总体看到规模趋势、也可以不断下钻看到细节。类比用户研究,相当于除了定量数据,你还能做定性研究,看到每个具体用户的信息和真实的声音。 记住它擅长的事,如果你再拿它来做静态的条形图,那它真的只能是个很贵又很难用的EXCEL。

下面分享一个案例,是今年我在tableau viz 可视化比赛的作品。请看链接:https://public.tableau.com/profile/fei.huang#!/vizhome/TableauViz_sh_final_Feihuang/1

数据是一些投资机构(包括IDG、红杉资本、阿里、腾讯等)的投资数据。数据很简单,11列X1975行。示例如下:

*数据经Tableau方处理,回报率不代表真实回报率

Story-把数据串成一个故事

Teablau形式有worksheet, dashboard, story。worksheet相当于单个的图表,dashboard把多个worksheet拼成一个页面,而story就把多页数据串成一个故事。

现场只有30分钟完成作品,需要呈现故事性,所以我做了个5页的strory。

page1"感受投资风潮" ——“页面”功能实现时间轴动态

这一页只是引入,让观众感受下十年间投资的变化,展示总体趋势。图中每个圆点是一次投资,圆圈大小表示投资额,颜色深浅为时间先后,文字标注展示投资机构和投资对象的名字,每个圆圈鼠标上移有具体每个项目的信息, "页面“可以选择时间,也可以动态播放。

1999~2016的16年期间,这10家机构在各地投资1974个项目,总金额超过2000亿元。

TIPS: 永远记得你的屏幕是个平面,横竖就真的只能展示二维,每增加一个数据维度,就需要在图上增加一种能量化的元素, 比如颜色、圆圈大小。当然对时间数据,还有一个利器是动态图。元素越多、图就越难理解,一定要根据展示意图有所取舍。

page2 "看清投资风向" ——“效果”功能实现两个图表之间的联动

这一页的上图是投资金额在各机构的分布随时间的变化,每个颜色代表一家投资机构。早期是IDG、红杉等专业投资机构为主,2008年会后腾讯和阿里开始入局,在2012年前后逐渐成为投资巨头。

下图展示的是投资的行业分布,每个颜色为一个行业、每个小格子为一个投资对象,通过筛选器选择时间。早期投资对象为房产、旅游业,后期投资行业越来越多,涉及各个领域,在2016年投资行业第一名为金融业,第一名是京东金融、融资66亿。

这图最妙的地方是在鼠标指到上图的某个时间、某个投资机构,下面的图会展示该机构在那个时间的投资行业和对象分布。你会看到腾讯2008年还只投资游戏和广告,2015年它投资涉及16个行业,项目数都数不过来。

TIPS: 每个读者关注的角度可能不一样,比如我会对腾讯的投资感兴趣,阿里的读者可能关注阿里的,因此允许用户自由探索,可以让不同的人关注到不一样的细节。

page3"评估投资及回报"——箱线图+散点,展示个体和整体的水平

这个图比较简单,左图放的是整体的投资金额和回报率曲线。平均投资金额在14年后暴增,平均回报率则基本稳定在0.5。

右图放的是不同轮次的投资金额和回报率变化,投资金额从种子轮到A/B/C/D/E轮融资金额越来越大,但在每一个阶段都可能得到从0到1的投资回报率。也可以看到,并购类的回报率整体偏高,战略投资金额很高、但回报率不高。

除了箱线图展示各轮次的整体水平,每个散点都展示了一个具体项目,鼠标上移到具体的点,就能看到超出平均水平的这些点,具体都是什么项目。

TIPS: 投资金额和回报率跟什么东西有关?有些人会试图强制找到规律,做个回归曲线之类的,但这数据连续变量只有金额和回报率,他两之间并不是正相关关系,再加上极值很多、即使有模型也并不适用。通过桌面研究和整理数据后来发现,金额最重要的变量是投资轮次,而回报率,没有规律就是最大的规律。

page4 “探索优质项目”——聚类分析产生新变量

这一页比较复杂,首先左上角的图,根据投资金额和回报率,把所有项目通过tableau内置的聚类算法分成6类,直观的看到:高投资金额分为高回报和低回报,低投资金额分为低、中低、中高、高回报。

项目分为六类后,右上角图展示的是各家投资机构六类项目的分布,看到高投资项目主要是阿里、腾讯、红杉,而低投资的项目,除了光源资本,各家都有低、中低、中高、高回报项目,只是比例略有不同。

下图则展示的是所有投资项目获得的投资的轮次、以及每一次融资的详情,这时候这个图几乎已经把所有的数据都展示出来了。用LOD功能计算每个项目的投资轮次、按轮次排序。

同样它可以跟上面两个图做联动。比如选择一个高投资、低回报的一次投资,投资对象是美团,可以看到美团在A B 轮时主要是低/中低回报的,C轮是低投资高回报,E轮则进入高投资阶段,投资他的机构有每轮都参与的红杉,以及腾讯和阿里巴巴。

TIPS:tableau的“提示框”,可以把所有相关的明细信息都放进去,鼠标上移的时候,就能马上看到详细的信息。

page5“end”——展示每一个数据点

这一页只是个结尾页,没有很多信息,上面每一个点展示的是一次投资,颜色表示行业、大小表示投资额。

你是不是想投诉我图片都看不清,看不清————说明tableau做的事情不是图片能解决的~

请再看一次tableau public链接:https://public.tableau.com/profile/fei.huang#!/vizhome/TableauViz_sh_final_Feihuang/1

本文仅代

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏DT数据侠

论IT业,深圳可能要比上海领先不止两年呢

作为“一夜崛起之城”,深圳城市的发展速度众所周知。其实,“深圳速度”不仅体现在盖高楼,更体现在工作岗位的升级变迁上。在7月27日的深圳城市大数据活跃报告发布会现...

600
来自专栏大数据挖掘DT机器学习

6万部豆瓣电影数据,如何做数据分析?

1 前言 豆瓣电影提供最新的电影介绍及评论包括上映影片的影讯查询及购票服务。你可以记录想看、在看和看过的电影电视剧,顺便打分、写影评,极大地方便了人们的生活...

3108
来自专栏大数据文摘

全球经济寒冬将至?且看顶级资本大鳄的大数据分析预测

1719
来自专栏量子位

Hinton:人类就是机器,绝妙的机器

原文《Mr.Robot》刊载于 Toronto Life 作者 KATRINA ONSTAD 摄影 DANIEL EHRENWORTH 编译 夏乙 唐旭 量子位...

3379
来自专栏AI科技大本营的专栏

超越美国?加拿大何以培育出人工智能的新边疆

前两天,加拿大政府推动人工智能发展的财政预算正式出炉,用1.25亿加元来支持人工智能领域的新研究与人才战略。 其中的关键,是资助多伦多新成立的人工智能研究机构...

2878
来自专栏华章科技

全球经济寒冬将至?且看顶级资本大鳄的大数据分析预测

[编者按] 当今全球经济风起云涌,全球市场普遍不景气,资本缩水,油价下跌严重,诸多大企业纷纷裁员,一时间经济唱衰的声音越来越多。《大数据文摘--商业与金融专栏》...

782
来自专栏CDA数据分析师

想太多,何不扎实的学?【统计学经典教材书单】

一、统计学基础部分 1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译 中国统计出版社 据说是统计思想讲得最好的一本书,读了部分章节,受益...

26510
来自专栏凌帅的阅读思考与实践

《股民的自我修养》读书笔记三:关于降维攻击

《三体》这部书里描述太阳系是这样毁灭的:外星人与地球人大战,使出了最终极的武器,先改变自己的维度,把自己从三维生物降低到二维生物,然后用一种二向箔...

471
来自专栏公众号文章

熊彼特的创新理论:非连续性模型

主流的经济理论讲供给平衡,经济在不受外力干扰的情况下,最终会趋于并保持在均衡状态。而熊彼特却认为经济很少处于均衡状态,它总是从一个均衡走向另一个均衡。在这个过程...

2022
来自专栏腾讯防水墙

为什么无牙象越来越多?防水墙助力大象公益,拒绝象牙买卖

852

扫码关注云+社区