<数据猿导读>
Uber数据可视化团队的理念是将Uber后台的大量数据,通过数据可视分析工具实现情报分析。Uber系统每天需要管理近十亿GPS数据。Uber的数据可视化其实是用很多种方式为我们讲故事。它可以创建周围的数据,例如:安全,效率,交通,或Uber在公共交通网络的作用
早上上班的时候不想挤地铁,打个UBER好啦;
下班的时候没地铁啦,打个UBER好啦!
是的,这款让人又爱又恨的打车软件已经潜入我们的生活,他们从来不说他们是出租车公司,他们说自己是大数据企业。那么他们是如何做大数据的呢?往下看看吧。
2015年初,UBER 开始正式组建数据可视化团队。其理念,是将UBER 后台的大量数据,通过数据可视分析工具实现情报分析。UBER 系统每天需要管理近十亿GPS数据。每一分钟,这个平台都要处理数以百万计算的移动数据。如果不用这项技术去分析和理解这些信息或时间,就等于错过了更全面了解业务的机会。
自成立以来,UBER 数据可视化团队已经从只有一名创始人和一名工程师的小组,发展成为一个15人的团队。数据可视化专家的技术包括从计算机图形跨越到信息设计,涵盖了创意技术和网络平台的发展等。团队更注重于面向这些公众数据进行视觉呈现、数据分析和框架开发,去完成可视化分析。
可视分析:
让数据可操作
UBER A /B测试平台的图表和置信区间的可视化功能。
可视化分析主要包括抽象数据可视化。这是指可视化中的数据没有固有的空间结构。相反的,今天更提倡科学可视化的概念,即将地理信息、空间信息、3D模型等结构化和非结构化数据进行最直观的可视分析。这时会涉及到大量数据,如:报表、仪表盘等。同时,将实时更新的网络数据进行实时分析。
UBER 可视化团队,一方面着力于更多的业务洞察和数据可视化的探索。另一方面着力于,搭建可视化系统,包括A / B内部的测试平台和大型机学习平台。
UBER 团队正在尝试构建一些可重组组件的应用程序。最近开源了一些代码,提供了一种基于JSX的基本视觉元素相关的特定语言编程。
制图:
富有探索性数据
地理信息是UBER 数量最大也是最有具价值的资产之一。UBER 平台每天都要处理数十亿的基于地理信息的GPS实时定位数据,要将这些数据进行可视化和可视分析,是一个巨大的挑战。
拖动鼠标在既定的半径区域内显示峭壁地形分布
UBER 可视化团队,根据不同的客户开发了多个地图应用程序。一种客户是在UBER 覆盖的400多座城市中的普通管理人员和城市运维团队。这个群体需要实时了解供应和需求分布信息。他们可能还需要一些汇总数据,以便更好地了解这个城市的市场营销活动。
另一种客户是数据科学研究人员,他们需要富有探索性的多维数据的接口(分解产品、时间和地理)。UBER 利用自身所获取的数据进行分析,为他们建立应用程序,帮助他们更清晰的了解数据。
UBER 开发并开源了几个应用程序库。react-map-gl 提供 React-friendly 顶层的 MapboxGL,程序库的Mapbox 来自数据量庞大的UBER 后台。deck.gl 提供一个接口用于创建 WebGL- 驱动层,可以把地图上的数据或独立使用的抽象数据进行可视化。
deck.gl 和 react-map-gl 提供 WebGL 接口,创建数据密集型应用程序。
但是,所有的这些技术可以以更好的方式去呈现和应用。数据可视化的强有力的作用是视觉上的叙述和数据的艺术形式。
面向公众:
让数据讲故事
UBER 的数据可视化有很多种方式为我们讲故事。它可以创建周围的数据,例如:安全,效率,交通,或Uber在公共交通网络的作用。
UBER 可视化团队最近探讨的了一个问题,uberPOOL如何更有效的配置城市交通。在Travis Kalanick的TED演讲视频中,可以一览UBER 团队制作的数据可视化的展示案例,通过对比使用uberPOOL街段交通和未使用uberPOOL的阶段交通的交通流量,呈现城市交通状况。
左:没有uberPOOL时遇到交通拥堵的市中心。
右:POOL中移动的车流更通畅。
UBER 可视分析团队也将持续研究更清晰的展现方式。
这项工作是混杂了数据、艺术、图表、数据新闻等各个领域的一个非常有意思的挑战。在做内部产品可视化分析时,数据处理是又一项充满挑战的工作,但视觉上的美观起着至关重要的作用,在视觉刺激和人对信息的消化总往往比信息技术更加有效,设计拥有更大的优先权。 3D技术 基于地理信息真实的展示了UBER的一天:
旧金山
▼
洛杉矶
▼