专栏首页CDA数据分析师可视化 | Uber 工程智能大数据可视分析案例

可视化 | Uber 工程智能大数据可视分析案例

UBER这款让人又爱又恨的打车软件已经潜入我们的生活,他们从来不说他们是出租车公司,他们说自己是大数据企业。那么他们是如何做大数据的呢?往下看看吧。

前言

2015年初,UBER 开始正式组建数据可视化团队。其理念,是将UBER 后台的大量数据,通过数据可视分析工具实现情报分析。UBER 系统每天需要管理近十亿GPS数据。每一分钟,这个平台都要处理数以百万计算的移动数据。如果不用这项技术去分析和理解这些信息或时间,就等于错过了更全面了解业务的机会。

自成立以来,UBER 数据可视化团队已经从只有一名创始人和一名工程师的小组,发展成为一个15人的团队。数据可视化专家的技术包括从计算机图形跨越到信息设计,涵盖了创意技术和网络平台的发展等。团队更注重于面向这些公众数据进行视觉呈现、数据分析和框架开发,去完成可视化分析。

可视分析:让数据可操作

UBER A /B测试平台的图表和置信区间的可视化功能。

可视化分析主要包括抽象数据可视化。这是指可视化中的数据没有固有的空间结构。相反的,今天更提倡科学可视化的概念,即将地理信息、空间信息、3D模型等结构化和非结构化数据进行最直观的可视分析。这时会涉及到大量数据,如:报表、仪表盘等。同时,将实时更新的网络数据进行实时分析。

UBER 可视化团队,一方面着力于更多的业务洞察和数据可视化的探索。另一方面着力于,搭建可视化系统,包括A / B内部的测试平台和大型机学习平台。

UBER 团队正在尝试构建一些可重组组件的应用程序。最近开源了一些代码,提供了一种基于JSX的基本视觉元素相关的特定语言编程。

制图:富有探索性数据

地理信息是UBER 数量最大也是最有具价值的资产之一。UBER 平台每天都要处理数十亿的基于地理信息的GPS实时定位数据,要将这些数据进行可视化和可视分析,是一个巨大的挑战。

拖动鼠标在既定的半径区域内显示峭壁地形分布。

UBER 可视化团队,根据不同的客户开发了多个地图应用程序。一种客户是在UBER 覆盖的400多座城市中的普通管理人员和城市运维团队。这个群体需要实时了解供应和需求分布信息。他们可能还需要一些汇总数据,以便更好地了解这个城市的市场营销活动。

另一种客户是数据科学研究人员,他们需要富有探索性的多维数据的接口(分解产品、时间和地理)。UBER 利用自身所获取的数据进行分析,为他们建立应用程序,帮助他们更清晰的了解数据。

UBER 开发并开源了几个应用程序库。react-map-gl 提供 React-friendly 顶层的 MapboxGL,程序库的Mapbox 来自数据量庞大的UBER 后台。deck.gl 提供一个接口用于创建 WebGL- 驱动层,可以把地图上的数据或独立使用的抽象数据进行可视化。

deck.gl 和 react-map-gl 提供 WebGL 接口,创建数据密集型应用程序。

但是,所有的这些技术可以以更好的方式去呈现和应用。数据可视化的强有力的作用是视觉上的叙述和数据的艺术形式。

面向公众:让数据讲故事

UBER 的数据可视化有很多种方式为我们讲故事。它可以创建周围的数据,例如:安全,效率,交通,或Uber在公共交通网络的作用。

UBER 可视化团队最近探讨的了一个问题,uberPOOL如何更有效的配置城市交通。在Travis Kalanick的TED演讲视频中,可以一览UBER 团队制作的数据可视化的展示案例,通过对比使用uberPOOL街段交通和未使用uberPOOL的阶段交通的交通流量,呈现城市交通状况。

左:没有uberPOOL时遇到交通拥堵的市中心。右:POOL中移动的车流更通畅。

UBER 可视分析团队也将持续研究更清晰的展现方式。这项工作是混杂了数据、艺术、图表、数据新闻等各个领域的一个非常有意思的挑战。在做内部产品可视化分析时,数据处理是又一项充满挑战的工作,但视觉上的美观起着至关重要的作用,在视觉刺激和人对信息的消化总往往比信息技术更加有效,设计拥有更大的优先权。

3D技术 基于地理信息真实的展示了UBER的一天:

旧金山

洛杉矶

来源 | 海云数据

本文分享自微信公众号 - CDA数据分析师(cdacdacda),作者:海云数据

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-05-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 好书 | 《数据之美:一本书学会可视化设计》

    书名:《数据之美:一本书学会可视化设计》 作者:邱南森(Nathan Yau) 出版社:中国人民大学出版社 ? 推荐理由 《经济学人》杂志2013年年度推荐的三...

    CDA数据分析师
  • 十个很酷的数据可视化项目

    数据可视化是科学、艺术和设计的结合,当枯燥隐晦的数据被数据科学家们以优雅、简明、直观的视觉方式呈现时,带给人们的不仅仅是一种全新的观察世界的方法,而且往往具备艺...

    CDA数据分析师
  • 【前景】“数据分析”成了“金饭碗” !

    三年前,“数据科学家”这种职业还基本不存在,如今“数据分析”成了“金饭碗”。 世界迈进了大数据时代。互联网和智能手机产生的数据“大爆炸”催生了提...

    CDA数据分析师
  • Uber大数据可视分析:让数据为用户讲故事

    <数据猿导读> Uber数据可视化团队的理念是将Uber后台的大量数据,通过数据可视分析工具实现情报分析。Uber系统每天需要管理近十亿GPS数据。Uber的数...

    数据猿
  • 10 分钟用 Python 搞定数据可视化!

    走在大街上,满眼都是广告(说明市场经济发达,这是好事情),再观察一下广告,多是以各种样式的图形呈现,而不是简简单单地把数字呈现出来,即使是数字,也会想办法把数字...

    CSDN技术头条
  • 10 分钟用 Python 搞定数据可视化!

    走在大街上,满眼都是广告(说明市场经济发达,这是好事情),再观察一下广告,多是以各种样式的图形呈现,而不是简简单单地把数字呈现出来,即使是数字,也会想办法把数字...

    IT派
  • Log stash学习笔记(一)

    Logstash是一款开源的数据收集引擎,具备实时管道处理能力。简单来说,logstash作为数据源与数据存储分析工具之间的桥梁,结合 ElasticSearc...

    大江小浪
  • 大数据可视化——这些必须知道的工具!

    人们常说,数据是组织的生命线。然而,解析这些数据并有效地使用仍然是一个挑战。 ? 大数据可视化 假设拥有一个巨大的金矿,但不能使用。那么,作为一个金矿的拥有者有...

    企鹅号小编
  • 数据可视化的优秀入门书籍有哪些?

    问题:数据可视化的优秀入门书籍有哪些? 问题描述:作为一个深爱着并学习着新媒体设计的学生,我非常感兴趣数据可视化相关知识。我学习绘画设计十几年,对视觉信息敏感,...

    CSDN技术头条
  • 小姐姐教你定制一个Logstash Java Filter

    Logstash是用来收集数据,解析处理数据,最终输出数据到存储组件的处理引擎。数据处理流程为:

    Jared.Tan

扫码关注云+社区

领取腾讯云代金券