谷歌使用众包和机器学习攻克“停车难”,Google Earth 开源

【新智元导读】 “停车难”问题困扰车主的一个大问题。最近,谷歌研究员们开始使用机器学习的方法来攻克这一难题。

开车的时候,有大部分的时间要么是花费在堵车上,要么是花费在寻找停车位上。谷歌地图和 Waze 一类的产品,有一个长期的目标,那就是帮助人们更容易也更高效地导航。但是,直到现在为止,还没有一个工具能解决我们已经习以为常的“停车难”难题。

上周,谷歌地图在美国25个城市发布了一个面向Andriod的新功能,提供关于目的地附近的停车情况预测,以便司机能作出相应的计划。提供这一功能需要解决以下一些主要的难题:

  1. 空车位的情况根据时间、星期 、天气、特殊事件、假期等因素是高度变化的。问题如此复杂,所以关于免费停车位,目前几乎没有实时的信息。
  2. 即使是在那些用联网的停车计时器提供空车位信息的区域,这些数据并没有包含那些非法停车、持证停车或者提前离开的停车信息。
  3. 道路组成的是一个二维的图表,但是,停车图表的结构可能会是更加复杂的,车流的交汇包含多层信息,很可能包含了不同的布局。对于停车来说,供给与需求都是不断变化的,所以,即便是最好的系统也会面临着一建好就过时的风险。

要解决这些挑战,谷歌的研究员结合了众包(crowdsourcing)和机器学习技术,开发了一个系统,为司机提供关于目的地停车的信息,甚至还能帮助你决定出行方式。

在一个预览版本中,他们发现,出行方式按钮的点击率有显著的提高。这意味着,用户在对停车难的问题有了额外的了解后,他们会更愿意选择公共交通而不是驾车出行。

要为解决停车难的问题设计一个算法,需要三方面的技术:通过众包的方法获得地面实况数据;一个恰当的机器学习模型,以及一系列稳定的特征(features)来训练模型。

地面实况数据

搜集高质量的地面实况数据对于任何机器学习解决方案的开发来说通常都是一个关键的难题。谷歌的做法是,在不同的地点和时间,对司机进行采访,看他们是否遇到了停车难的问题。但是,我们发现,面对这样主观的问题,通常会得到相互矛盾的答案:在某一特定的地点,有人可能会觉得很“容易”找到停车位,但是其他人会觉得“很难”。

模型特征

有了这些可用的数据,下一步就是选择用来训练模型的特征。运用集体的智慧,该项目从愿意分享个人定位数据的用户中收集匿名信息,这已经是实时交通、热门停车时间和访问持续时间测量的重要信息来源。

谷歌研究员称,他们很快便发现,即便有了需要的数据,但是还是会有一些独特的挑战悬而未决。比如,如果有人在自己门前或者私人的停车位停车,系统不该错误地认为这里的停车位是可用的。用户搭乘出租车到达,可能会造成门前停车很多的假象,类似的,公共交通用户可能会被系统认为是在公家车站停车。这些错误的认知,都会误导机器学习系统。

因此,系统的设计需要更强大的聚合特征。不奇怪,其中一个功能的灵感来自谷歌所在的 Mountain View。如果Google导航观察到许多用户在午餐时间开着车在市中心绕圈,它表明停车可能非常困难:

谷歌的研究员在思考,如何把这些关于停车难的“蛛丝马迹”作为一个特征来进行训练。在这一例子中,研究员考虑了用户开车到门口和他们实际到达之间的差异,将绕圈、停车和步行作为参考因素。如果多数用户在二者之间所用的时间存在显著差异,就被认为是遇到了停车难的问题。

从那里,我们继续开发更多的功能,考虑到任何特定的目的地,停车位置的分散,日时钟和日期依赖的停车(例如,如果用户在清晨接近目的地,但是更远的繁忙时间?),历史停车数据等。

以这一点为基础,研究员进一步开发了更多的特征,将目的地的特殊性、停车位的分散、决定停车难问题的时间和日期、历史停车数据等都考虑了进来(例如,如果用户在早上停车离目的地比较近,但是在更繁忙的时候,只能停得远一些,会怎么样?)最终,他们得到了近20个不同的特征、4个模型。接下来就是调整模型性能了。

模型选择&训练

针对这些特征,研究员使用了一个标准的回归机器学习模型。这种选择有几个原因:首先,逻辑回归的原理是大家所熟知的,并且,在训练数据中,它对噪音是有弹性(resilient)的;第二,很自然地,可以将这些模型的输出解释为停车难的概率,然后可以将其映射成描述性术语,如“停车位有限”或“轻松停车”;第三,很容易理解每个特定特征的影响,这使得验证模型是否合理更加容易。例如,当我们开始训练时,我们许多人认为上述“蛛丝马迹”的功能将是“silver bullet”(良方),可以解决所遇到的难题。让人吃惊的是,情况根本不是这样,事实上,它是基于停车位置的分布特征的,这是停车难的最有力的预测之一。

结果

谷歌在官方博客中写道:使用我们的模型,我们能够生成关于任何地点和时间的停车难度的估计。下图给出了我们的系统的输出的几个例子,用于提供给定目的地的停车难度估计。例如,星期一上午,整个城市停车都是困难的,特别是在最繁忙的金融和零售区。在星期六晚上也很困难,但主要是在餐馆和景点地区。

谷歌的研究员说:“我们很高兴有机会根据用户反馈继续提高模型质量。如果我们能够更好地了解停车难度,我们将能够开发新的和更智能的停车辅助系统, 对于ML的未来应用,我们都很兴奋,希望AI能带来更让人享受的交通体验。”

Google Earth将开源

春节期间,谷歌还宣布了另外一件事:2017年1月30日,Google官方博客将开放源 Google Earth 企业版(GEE)。这一企业产品允许开发人员构建和托管自己的私有地图和3D地球仪。在这个版本中,GEE Fusion,GEE Server和GEE Portable Server源代码(全部470,000+行!)将于3月份在 Apache2 许可证下在GitHub上发布。

Google是在2015年3月宣布弃用和终止企业版销售。

为了给客户足够的时间过渡,Google提供了两年的维护期,这一维护期将于3月22日结束。Google称,开源GEE将给予客户社区继续改进和推进该项目。Google表示, Google Earth Enterprise客户端、Google Maps JavaScript API V3 和Google Earth API并不开源。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2017-02-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

「CDAS 在线」央企财会到数据分析师的华丽转变

原作者 CDA 数据分析师 去年的CDAS 2016 第三届中国数据分析师行业峰会上,有一个比较特别的分论坛。这个论坛的嘉宾有些原本并不是业内人士,但经...

2206
来自专栏PPV课数据科学社区

我们的挚爱——数据科学技术

数据科学家最爱的几款工具! 一个能干的数据科学家经常被看作是分析学中额的独角兽,这是因为他们的工作往往需要深厚的数学和统计学的知识、熟悉计算机科学,还要有掌握一...

3516
来自专栏AI科技大本营的专栏

机器学习到底能创造什么价值?我们精选了9位从业者的答案

来源 | HackerNews 编译 | 晓查 不温不火的机器学习忽然蹿红业界,也就是这两三年的事,于是不仅传统行业,连风光一时的互联网公司也开始疑惑:我们要不...

28311
来自专栏互联网数据官iCDO

运营研究的3个方法:过程法、要素法、分类法

作者:平章大人 全文共 2582 字 7 图,阅读需要 7 分钟 ———— / BEGIN / ———— 研究了这么久的营销和运营,我越发深刻地认可一句话:“上...

3097
来自专栏AI研习社

数据咨询师经验之谈:90% 的公司并不需要机器学习

编者按:掌握一件工具之前,首先要搞清楚用它做什么。而本质是工具的机器学习,近年来逐渐演变成一股潮流。 在美国企业数据方案咨询师 Eric Brown 看来,当下...

3787
来自专栏机器之心

观点 | 低门槛究竟是深度学习的危机,还是契机?

选自reddit 机器之心编译 参与:黄小天、刘晓坤 近日,Reddit 上出现了一个颇有争议性的问题,提问者怀疑深度学习的低门槛会破坏这个领域的声誉,业余者的...

3027

企业的AI层和物联网

根据德勤去年的预测,截至2016年底,按收入划分全球100家最大的企业软件公司中有80多家将认知技术融入其产品中。“Gartner还预测,新投资的40%企业将在...

34210
来自专栏BestSDK

战胜李世石的AlphaGo又出新大招:用神经网络看病

很有意思的是,从当前DeepMind所做的事情里我们其实可以抽取出一些更有价值的模式,比如什么是人工智能+,到底应该怎么加。 案例1:降低能源消耗 DeepMi...

2515
来自专栏CSDN技术头条

科研算法的敏捷应用

我记得几个月前看到Deep Dream研究员们(Leon A. Gatys, Alexander S. Ecker and Matthias Bethge)发布...

21710
来自专栏机器人网

常见的机器学习9个误区

机器学习已经被证明是很有用的,但也容易被假设可以解决所有问题、适用于所有情况。和其他工具一样,机器学习在特定领域很有用处,特别是那些你一直都知道有、但永远无法雇...

923

扫码关注云+社区

领取腾讯云代金券