拆解滴滴大脑 叶杰平谈出行领域算法技术

近日,滴滴研究院副院长叶杰平在上海一场内部分享会上详细解读了滴滴大脑,这是外部首次窥探到较为完整的滴滴算法世界,并且一直潜水的产品“九霄”也首次露出真容。

滴滴大脑由三部分组成

  叶杰平将滴滴大脑这个智能系统分为三部分,分别是大数据、机器学习和云计算。

  其中大数据就像工业革命时代的煤一样举足轻重,人工智能需要数据进行训练,纵观应用级深度学习的成功案例,他们都获得了海量数据,像谷歌和Facebook这样的公司都可以获取大量数据,这种优势让他们可以创造更有效的新工具。

  而机器学习是人工智能的核心,一套系统通过机器自我学习的方式来实现人工智能,算法则是机器学习的关键要素。滴滴搭建的核心算法模型,可以帮助实现更准确的预测能力、智能的调配能力,提高效率降低成本,达到最优运力调度。

  云计算提供强大、灵活的计算能力,滴滴的业务场景对计算要求和实时性都非常高,用户输入一个目的地,最佳合理调度都由滴滴大脑以毫秒级的速度来计算,例如通过滴滴云计算搭建了大规模实时分单处理平台,可以实现多维度最佳订单匹配。滴滴平台已经有数万台服务器,未来两年服务器规模将达到数十万台。

  叶杰平揭秘的算法世界是滴滴大脑最为核心的技术之一,滴滴研究院解决的技术难题,包括供需预测、路径规划、智能派单等都离不开算法。此外,在提高用户乘车体验上,也引入了人工智能,比如服务分和机器判责等功能背后都是通过复杂的机器学习算法技术来实现。

滴滴大脑每两秒进行一次判断,要考虑N步走法

  打个比喻,每一次分单,就如同下棋,需要考虑之后N步的走法,也就是预测未来,滴滴大脑每2秒进行一次全局的判断,在迅速的大量计算中,完成全局最优的智能派单,对于这些背后的技术,叶杰平在这次内部分享中作了详细解读:

 1、供需预测

  大数据的神奇之处就在于可以通过搜集到的数据,进行处理分析后,得到规律,然后利用这个规律来对未来进行预测。

  最近比较有名的例子是一套名为MogIA的人工智能系统成功预测出川普将成为美国总统,这套亮相于2004年的系统,也曾经对以往三次总统选举进行过成功预测。去年,开发者设计的算法又一次准确预测出了最后关头共和党方面取得的后起势头。

  大数据还可以预测天气、预测地震,甚至预测你会不会生病等,而在交通方面,大数据预测的能力就极为重要,可以预测什么时间什么地方会拥堵。

  大数据预测的关键是足够多的高质量的数据。当前滴滴在交通领域的数据量全球第一,每日峰值订单超过2000万单、每日处理数据超过2000TB,覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度,它所掌握的巨大的真实数据除了帮助预测路况外,还能对供需进行预测,供需预测越准确,越能更好的解决供需不平衡问题。

  滴滴目前对15分钟后供需预测的准确度已经达到了85%,基于这样高的准确率,平台可以调度司机满足未来的打车需求,有效降低未来该区域供需不平衡的概率。甚至可以畅想,有一天滴滴将能精准地知道,星期五夜晚,雨天或雪天,港丽酒店门口有多少乘客需求,附近有多少运力?

 2、路径规划

  路径规划和ETA两项地图技术是实现智能派单的关键,也将直接影响到司乘双方的使用体验。

  通过海量历史数据,可以对未来路况做预测,实现A点到B点的路径规划,它是派单的核心,工程师围绕最低的价格、最高的司机效率和最佳交通系统运行效率来做算法。

  ETA指预估任意起终点所需的行驶时间,要求精准性。滴滴是国内第一家把机器学习成功应用到ETA的公司,这是解决“订单高效匹配”和“司机运力调度”的关键技术。当前滴滴ETA可以预测每一单出行的时长以及预估在每一个路口前的等待时长。有了这项技术,可以在更合适的时间对运力进行更好的调度。

  3、智能派单

  用滴滴叫车,和搜索的逻辑不同,网上的商品、资讯等信息都是静态停留在那里,计算方式只是将这个商品、信息挖掘出来即可,而滴滴的计算则类似于动态打靶,车辆永远在运动当中,要在众多运动的车辆中,给乘客一个最优的选择,不光是距离,时间也是。也就是实现平台效率和用户体验最大化。智能派单对订单量和司机数进行预测,然后通过大规模分布式计算来实现上述的最优撮合。

  为了实现这一目的,供需预测、动调调价、路径规划以及服务分的算法技术要一起发挥作用,他们最终为实现最优派单而服务,他们的算法都将结合到智能派单系统中,帮助在动态环境中撮合乘客与司机的交易。

  据悉,目前高峰期滴滴平台每分钟接收超过3万乘客需求,每两秒钟作一次订单匹配,每一次发单背后,滴滴大脑运算次数达到百亿次级别。

4、服务分和司乘判责

  滴滴使用大数据技术来预估每个司机的服务分值,包括乘客打分、乘客评价以及取消率等因素,并利用算法模型来计算不同服务水平的司机对用户产生的长期影响。

  滴滴在2016年9月上线服务信用体系后,司机拥有个人专属的服务信用档案和服务分值,为乘客提供优质服务的车主可获得更高的服务分,从而获得更多的订单和收入。目前服务分已与滴滴的智能派单系统结合,在距离、车型等条件类似的情况下,系统将优先派单给服务分较高的车主,帮助服务优良的车主获得高的收入。上述服务信用体系就是利用人工智能建立算法模型来实现,该信用体系上线后,用户投诉率和订单取消率都显著下降。

  保证安全体验,服务分是手段之一,提高司机服务质量,用大数据机器学习模型来计算司机当前服务分,通过交易引擎系统来保证服务分高的司机收入越高,司机就有动力来提高服务。

  除了服务分外,滴滴还通过大数据和机器学习模型来进行司乘判责。服务分里重要的几项因素包括乘客取消订单、投诉,以及文字评价等,需要系统来作智能判责,针对当次取消行为,判断司机是否有责?乘客是否有责?去年12月15日全国上线了智能取消判责系统后,司机的满意度得到显著提高。

5、九霄

  九霄是滴滴大数据孵化的出行领域智能决策的技术创新产品,能够把错综复杂的时间、空间、业务维度的n次元出行领域数据,转化成易于理解的2次元数据,搭建数据理解的桥梁;帮助运营、产品、BI、研发同学发现问题、分析问题、解决问题,产生切实的业务收益;提升业务决策效率和决策效益。

  滴滴将出行领域的数据,进行整理、挖掘、智能聚合,在地图空间和时间轴上进行合理的呈现,使用户能够直观的感知在什么时间、什么地点、各个业务线的什么业务维度(乘客、订单、运力、体验等),发生了什么,方便深入追踪和探寻业务痛点和原因分析。

  同时,利用机器学习、数据挖掘的方法帮助运营、产品、BI、研发同学发现/分析和解决实际问题,产生切实的业务收益。

  举个例子,比如通过九霄对地图上任意区域的供需平衡状况、订单满足情况能够一目了然,并且结合九霄的精细化分析能力,能够进行细化到某个地理围栏的供需策略,进行围栏级别的运力调度策略配置;(在代驾场景上)基于机器学习进行供需预测,判断哪些区域存在运力缺口,自动化调度司机调节供需平衡。

  九霄通过科学可视化技术能力、算法能力和高性能架构能力,将数据变为知识,用知识武装决策、改变出行。

  数据正在迅速生产,算法和计算平台都需要越来越快的速度

  叶杰平表示,算法世界犹如一个浩瀚的星空,没有边际。因为没有一个算法是通用的,每个具体问题就需要一个算法,如何结合业务场景找到最合适的算法是一大挑战。

  “算法已经变得非常重要,随着每天数据量迅速增大,现有算法不分昼夜都处理不完,可以说现在算法的分析速度远跟不上数据的产生速度,算法和计算平台需要越来越快的速度。”

  最后再来一个具体的示例图:

来源:CSDN

本文分享自微信公众号 - PPV课数据科学社区(ppvke123)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-02-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【学习】竞争对手的分析方法

确定了你的竞争对手并收集到足够数据后,我们就要对他们进行深度分析了。 竞争对手分析路径 竞争对手分析共分为10个步骤,如图1是分析路线图。这个分析路线图侧重于企...

558100
来自专栏罗超频道

如何让搜索引擎拥有“生命”?

在许多人看来搜索引擎只是一个检索工具,就像其他冷冰冰的科技产品一样。实际上,搜索引擎正在成为人人依赖的智能助手。它在拥有感知环境和自我学习的能力后,随着岁月流逝...

38850
来自专栏腾讯大讲堂的专栏

2017腾讯创新日 | 科技引领潮流,创新打造未来

创新充满挑战,科技提供更多可能,随着社会的不断前进,科技、创新越来越深入我们的工作和生活中。勇于挑战自我、专研业务技术的腾讯人在6.14日举办了2017年“腾讯...

41060
来自专栏DT数据侠

当机器都会“学习”了,你还想不学习么? | 数据科学50人· 谢梁

如今,我们每个人都在谈论“数据科学”,《哈佛商业评论》杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟...

11300
来自专栏专知

【重磅】《人工智能标准化白皮书(2018)》发布(完整版)(附下载链接)

【导读】1月18日,召开国家人工智能标准化总体组、专家咨询组成立大会,在会上,国家标准化管理委员会宣布成立国家人工智能标准化总体组、专家咨询组,负责全面统筹规划...

62770
来自专栏AI科技大本营的专栏

资源|2018年14个顶级AI和机器学习会议名录

编译 | AI 【AI科技大本营导读】人工智能和机器学习已经跳出科幻小说的范畴,冲进了现实。不管是技术层面还是商业环境方面,这些领域都在迅速发展,紧跟潮流的步伐...

40860
来自专栏新智元

商汤科技徐立:AI 将在10 年内创造一个印度和中国的总产值

【新智元导读】3月22日,清华大学《人工智能前沿与产业趋势》系列课程第二讲开课,本讲聚焦当前AI领域最火、落地应用最成功的计算机视觉,由商汤科技CEO徐立主讲。...

391120
来自专栏ATYUN订阅号

谷歌推出新的AI技术,旨在打击网络儿童性虐待内容

谷歌今天宣布推出新的AI技术,旨在帮助识别网络儿童性虐待材料(CSAM)并减少评论者接触到此类内容。

12220
来自专栏人称T客

云计算的热度下降了?非也|双语

T客汇官网:www.tikehui.com 原文作者|Jason Sparapani 译者|张苏月 ? Gartner预测公有云市场2016年将增长16.5%,...

30350
来自专栏数据冰山

奥迪大喊六声,又出了张皮蛋

6月5日,奥迪把Q8的全球首发放在深圳,一面数据的小伙伴近水楼台,从深南大道的办公楼跑去欢乐海岸一睹新车。发布会现场当然气氛热烈,但是Q8这款车在广大网友心目中...

12320

扫码关注云+社区

领取腾讯云代金券