前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >中国优步大数据负责人江天:优步交通大数据探索与应用

中国优步大数据负责人江天:优步交通大数据探索与应用

作者头像
数据猿
发布2018-04-19 17:11:06
8900
发布2018-04-19 17:11:06
举报
文章被收录于专栏:数据猿

<数据猿导读>

中国优步大数据负责人江天在中国信息通信大数据大会上发表了以“优步交通大数据探索与应用”为主题的演讲。他讲到,优步的大数据应用有两个方向:一是利用大数据进行分析处理,提升企业产品和运营的效率。另一方面,当企业做的足够大的时候,需要考虑我们这种服务的外部性

数据猿报道,2016年4月20-21日,2016中国信息通信大数据大会在京召开。大会以“开放共享、转型创新”为主题,聚焦通信业大数据产业生态,邀请工信部、院士专家、三大运营商集团及省市大数据相关业务部门领导以及领先的大数据产业领军企业及应用单位代表出席,共同探讨通信业大数据发展带来的产业机遇和挑战。

本次大会主要针对前沿ICT技术与解决方案对运营商大数据能力建设的提升以及业务运营、架构的转型影响,通信业大数据的开放应用以及开放、共享、创新的产业生态等热点话题展开讨论,全景展现运营商大数据能力建设规划与开放应用策略。

本文由“135编辑器”提供技术支持

以下是数据猿现场独家直播“中国优步大数据负责人江天”的发言实录:

江天:非常荣幸今天有机会在这里跟大家分享一些优步在大数据领域的一些探索。刚才听到了很多我们传统行业运营商对数据的理解,我自己是受益颇多。现在我想分享一些我们互联网公司对大数据的一些应用和探索,优步大家可能很熟悉,我们是一家互联网公司,我们所提供的服务非常简单,就是将闲置的车辆资源、司机和有个性化需求的出行者进行一个有效的连接。

下面简单介绍一下我们优步的发展情况,我们现在已经在全球60多个国家,400多个城市提供出行服务,我们09年起源于美国的旧金山,之后在美国逐步拓展,在欧洲进入的第一个城市是巴黎,之后随着我们业务的拓展,我们现在在中国也有50多个以上的城市来提供这样的服务。大家可以看到我们扩张速度非常快,我们平均1.8天在全球就会进入一个新的城市。

我们具体到一个城市我们发展的速度和规模到底是多快呢?我们也通过我们的大数据做这样一个可视化的展示。大家可以看到这是我们2015年去年1月份在北京一个服务的范围,7月短短半年时间,大家可以看到我们从服务的区域和服务的范围都有非常大规模的拓展。大家可以看到这是同一时间段我们一月份的运营状况和七月的运营状况的对比。

下面我们回归今天的主题,优步有哪些数据,我们是如何利用我们技术手段,来对这些数据进行分析、处理和应用的。首先看看我们优步有哪些数据,现在在四百多个城市收集数以百万计个性化的出行信息,我们可以了解我们的出行者从什么时间,从哪里出发,去哪里,选择哪些路径。

作为一个企业,我们认为大数据的应用有两个方向。一个方向是我们利用大数据的分析处理,不断提升我们企业本身的产品和运营效率。另一方面,当我们企业做的足够大的时候,我们需要考虑我们这种服务的外部性。比如我们对拥堵是什么影响,我们对公交是什么影响,我们对出租车是什么影响。下面我也会分两个方面来介绍我们优步在大数据领域的一些应用。

首先大家可以看到这张图是我们在旧金山做的一个实时的用户出行的分布图,蓝色的点就是用户出行者的起点,黄色的点是终点,随着夜里两点,早上六点、十点,下午的两点、六点、十点,出行特征是完全不同的。同样在整个城市范围,这是纽约,我们可以看到黄色的区域也就是我们纽约的商业核心区,大家可以看到上午的时候很多出行是从周边的区域来聚集到中心的一个核心的商业区。而到了晚上,这种出行的高峰特点是相反的,我们可以实时掌握出行的变化。

我们在内部开发了这样一个工具,可以让我们的运营人员实时来掌握我们不同区域的出行特点。因为我们优步所从事的这个行业其实是一个非常实时的行业,我们需要实时了解我们的用户是从哪到哪的,这样我们才能高效的、合理的来分配我们的供给,来满足这样的需求。

大家可以看到我们做了旧金山一天的一个对比,一个平日和一个周末,根据他们的出行特点的不同,我们可以实时掌握这样的出行需求变化。左边这张图就是平日,早上七点到九点是早高峰出行的高峰期,而相对右边周末这张图而言,早上出行并没有那样的多。而右边这张图周末正好是旧金山有一场演唱会,开始时间是晚上八点。到六点开始,也就是我们平日出行的需求已经非常旺盛了。而到了晚十点以后,我们可以看到平日出行量已经开始慢慢减少了,而十一点的时候,我们右边演唱会结束之后,整个城市的出行依然是非常高峰的一个阶段。这就是我们开发的一个动态加价机制,也是通过价格杠杆,实时满足供给和需求不平衡。

大家对我们的产品比较了解,我们产品中的一大特点就是我们的派单机制。派单听起来很简单,把离你最近的车派给你,但是真正在我们大数据分析过程中是非常复杂的。比如只以距离为核心要素,你在机场高速这边,我在另一侧的车派给了你,这样你等待时间非常长,这是非常低效的匹配。我们会考虑到非常细节的因素,甚至交叉口、信号灯的因素。

比如一辆车离你很近,他需要左拐通过十字路口,另外一辆车离你较远,但是一个右拐就到了。最终我们的目的是希望让用户的等待时间最短。同时大家经常用我们的产品,可能知道我们有这样一个拼车产品的上线。这个产品大家看起来原理非常简单,但是实际上是我们一个战略级的产品。首先基本的原理,将两个车的行程路径进行实时的匹配,这样将两个行程合并成一个行程。

大家可以看到这个原理其实非常简单,大家都非常明白,但为什么说是战略级的呢?首先大家可以想像,如果你坐一辆出租车也好,专车也好,到达一个目的地,可能花费是十块钱。如果是拼车来完成这样一个行程,乘客一个人可能需要七块钱,所以乘客的支出降低了,而司机的收入增加了。这样我们作为平台,我们所抽取20%的平台费也增加了。

大家可以想像,我们现在在北京上线了我们的叫三拼,也就是三人的拼车,还有我们的连环拼,三个人在车上,有一个人下车了,又一个人上车了,车不会空驶,是高效的运转。我们在美国上线了我们的送餐和快递,现在是人和人拼,以后可能是货和货拼,这种极大的提升了我们的效率,降低了我们的成本。很多人问现在补贴大潮退去之后,你们还能保持比较低的价格吗?我们通过科技的手段增加运输效率的情况下,是可以维持低成本的运输服务的。

下面再说一个典型的,我们通过科技手段、数据手段来提升企业自身的一个服务水平的案例,也就是我们的安全。安全是大家都很关心的话题,首先我这里不是说优步是100%安全,没有风险的出行方式。但是作为一家互联网公司,一家科技公司,我们尝试用科技的手段来不断提升我们的安全服务水平,不断降低这种风险。

举个例子,我有时候出差的时候在上出租车会发现出租车运营证上的人和实际给我服务的司机不是一个司机。这时候我心里会有一些担心,我不知道这个司机有没有为我服务的能力。优步在中国5月份要上线这个产品,当每个司机上线的时候,他会在我们系统中进行刷脸,我们将他的人脸信息和当时他加入我们平台所提交的身份证照片的信息进行比对。当比对通过之后,他才能上线为大家服务。

同时传统的出租车,比如一个女学生夜里打一辆出租车到某个位置,她觉得不太安全,人员比较稀少,她没有一个手段来保护自己。而我们作为这样一个科技公司,在我们APP中加入一键报警的功能和紧急联系人呼叫的功能。一旦你在APP点击这个功能,我们会为你的位置信息、司机信息发送给你的亲友甚至执法部门。

同时我们还有匿名电话和黑名单制度,常用我们APP的用户会发现,你在给司机打电话的时候,不再是移动号码了,而是一个固定电话。这个就是我们通过技术手段,将个人隐私的手机信息进行了屏蔽。

我们的APP是有双向打分的制度,你下车之后可以给司机打分,司机也可以给你打分。不管因为什么原因,这个打分出现了一星的情况,换句话说,我们知道这个旅程是非常不愉快的,这种不愉快有可能是乘客造成的,有可能是司机造成的。作为我们平台来讲,将这种匹配列入黑名单。这种不愉快的旅程再也不会发生,从而降低我们安全的风险。

一开始提到我们对数据应用分为两个方向,一个是对我们自身的运营产品进行提升。另一方面,我们也在利用数据分析来提高社会经济的效益。

首先作为共享经济代表,我们增加就业机会。左边的图是我们在伦敦,我们的注册司机分布的区域,深色的区域也就是我们注册司机数量很多的区域。而右边这张图是伦敦的失业率的区域,深色的区域就是失业率较高的区域。通过对比我们可以发现,司机的注册量和失业率比较高的区域是有高度重叠性的,也就是说更多的为失业率高的区域提供了灵活的就业机会。

很多人都很好奇,在优步平台上到底能赚多少钱?我们通过我们的芝加哥这样一个案例分析,可以看到其实我们平台上80%的司机一周不到25小时,换句话说,周一到周五一天不足五个小时,我们司机大部分是兼职司机,是灵活就业的机会。我们可以看到这种蓝色的,部分的司机如果希望将优步这种专车服务作为一种全职的选择,一年可以赚到四万美金以上,足以养家糊口。

改革开放的时候有句老话,要想富,先修路。我们也在伦敦做了这样一个分析,因为交通很大程度上影响了一个区域的经济发展。我们可以看到哈肯尼区是比较落后的一个区域,它的基础设施相对比较落后,和伦敦商业核心区有一定的阻断。我们可以看到右边这张图是我们优步所服务的区域,往往是整个市域范围的,加强了经济相对落后区域和商业发达区的经济联系。

有一个话题最近很热,说专车是增加了拥堵还是减少了拥堵?我们通过我们的数据进行了分析。首先说到拥堵,无非就是两个维度,一个就是空间维度,一个是时间维度。

从时间上看,我们在上海的一个案例,表明我们优步出行高峰,一个高峰是凌晨12点以后,另外一个出行高峰是上午10点到下午3点。我们可以看到这个传统意义上的早高峰和万高峰有很大区别的,我们也在分析出行高峰会在夜里出行?我们很多客户是年轻人,他和朋友去KTV,出来的时候发现公共交通都停运了,出租车在这一时段的供给是非常低的,因此专车就成了最好的选择。同时在白天早10点到下午3点是商务出行的高峰期,这和我们平台上的商务用户是紧密相连的。

同时谈到拥堵的空间维度,我们对纽约进行了分析,黄色的区域是拥堵最严重的,特别是曼哈顿区域。在拥堵最严重的这些区域,出租车和优步的接单量的比例差不多是10:1,出租车在曼哈顿接10单,优步才接到1单。在这边周围紫色的区域,纽约的远郊区县,这些区域这种比例反而是相反的。有可能优步在这些区域接五六单,出租车只接一两单。优步和出租车服务的范围上应该说有一定的重叠性的,但是我们的差异性也是非常明显的。

如果对专车是否造成了拥堵还是减少了拥堵还有一定争议的话,拼车无疑是更加绿色,更加低碳的方式。下面展示一个我们在旧金山做的一个拼车的分析,旧金山是我们全球第一个上线拼车服务的城市。旧金山跟世界上很多大城市一样,交通是非常拥堵的。大家可以左边这张图是上线拼车之前的一个拥堵状况,而右边是上线拼车之后的一个交通情况,大家可以看到拥堵还是得到了很大的缓解。

最后一部分,分析一下我们通过大数据手段和传统行业的一些融合方面的分析。刚才谈到优步掌握了大量的个性化的出行信息,这种和传统行业的交通数据的采集是有很大程度区别的。传统行业靠线圈,靠视频,这种方式只能知道一个总体的宏观的流量,不能得到个体的精细的数据。我们优步知道起点和终点的数据,为城市的规划,为基础设施的建设,为公交线网的调整,都提供了数据支撑。

我们和公共交通是什么关系呢?左边这张图是墨尔本,黑色的线就是墨尔本的地铁网络。我们可以看到蓝色的区域就是地铁和常规公交所能覆盖到的公共交通服务的区域,灰色的区域我们称之为公交沙漠,这些区域是没有公交服务的。在右边可以看到优步的服务往往在一个城市是覆盖整个市域范围的,对公共交通没有覆盖的区域是一个延伸,是一个补充。

同时在上海我们做了这样一个数据分析,我们把起点或者终点在主要的地铁站点周边200米范围内的一个行程进行了一个提取和可视化分析。我们可以发现有30%的行程是开始或结束于地铁站周边的,因此说优步很好解决了最后一公里和公交接驳的问题。

最后看看我们和传统出租车的差别,我们在一个芝加哥的案例上看到,我们把我们优步所服务的区域和出租车所服务的区域进行了对比。我们可以发现52%优步所服务的区域在这些区域出租车的供给是严重不足的,我们和出租车存在竞争,但是也有补充的关系。我们优步的使命,是希望城市的交通运输能像流水一样畅通,我们会以一个非常开放的心态,和我们传统行业运营商或者信息服务商,能有进一步的合作,共同实现这样一个目标。谢谢大家!

来源:数据猿

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-05-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据猿 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档