揭秘Google地图:算法再强,也需人工

导航地图近十年已经发生了翻天覆地的变化。上世纪90年代,我们还在用纸质地图寻找目的地。而现在基本只需要服从Siri或她的谷歌竞争对手的导航指令。

“地面真相”(Ground Trut)算法和街景服务

不过这些导航指令背后隐藏着大多数人无法想象的众多数据。目前由于谷歌已经获得了极其庞大的地图数据,他们开始采用大数据方法,或谷歌称之为“地面真相”的算法和细致的人工努力相结合的方法,为用户提供更详尽的地图信息。该项目于2008年推出,但它一直处于保密状态,直到几年前才公开。它持续增长,现已覆盖51个国家。这一算法在提取卫星、空中和街景视图的信息时发挥了巨大的作用。

谷歌“地面真相”算法可以识别的街景信息

谷歌2007年推出了街景服务,通过让人们看到目的地周围的环境来提高用户体验。谷歌地图副总裁布莱恩·麦克伦登(Brian McClendon)。表示,“我们很快就意识到做地图的最佳途径之一,就是拥有全世界的街头照片。”

随着街景收集数据的增长,抽查他们的数据已经不是很好的解决方案。谷歌地图产品经理马尼克·古普塔(Manik Gupta)表示,现在街景车已经行驶700多万英里,覆盖美国99%的公共道路,“它实际上使我们能够利用算法建立提取信息之外的新数据层。”

这些算法借用计算机视觉和机器学习的方法来提取路边的街道编号、企业名称、限速交通标志等细节信息。 不过很多信息还是非常难以提取,麦克伦登表示,“停止标记常常很容易被忽略。转弯限制对于导航来说也很重要,但对于谷歌的捕捉算法还很难处理。因为这些标记箭头可能是被画在道路上,它们可以是不同的颜色和大小。车道标记的分析更难,因为他们并不一致。”

谷歌地图普通用户不可见的转弯限制信息。

路牌也是非常重要的信息。驾驶者听到的导航指示如果能匹配他们看到的,那么他们就能更好的被指引。但有时街道标志使用的拼写或缩写导致了很多麻烦。“匹配标志上的文字实际上是一个很困难的任务。”

另外,谷歌的算法还可以利用卫星和航空影像提取建筑物的轮廓和高度。美国大多数的建筑物现在都可以在谷歌地图上找到。对于像西雅图太空针塔这样的标志性建筑,计算机视觉技术已经可以提取出详细的3D模型。谷歌曾表示,它收购高分辨率卫星图像公司Skybox就是为了提高其地图的准确性。

计算机视觉技术提取的标志性建筑物3D模型

职业地图纠错团队和MapMaker计划

然而,卫星和算法的能力还是有限。为了提供最好的体验,谷歌雇佣了一只由人类组成的团队,手动检查并使用内部程序Atlas纠正地图的错误。谷歌公司以外很少有人见过这一应用。

这一人工检查团队看到的地图类似于谷歌地图的卫星地图混合视图,但带有没见过的彩色线条和符号。例如,道路根据行进方向进行了颜色编码。绿色和红色箭头指示了给定的交叉路口的可能前进方向。工作人员可以点击屏幕一侧的按钮,拖曳、切换或关闭各种层,控制街景视图拍摄的交通标志的出现和消失。这些工作人员每天要检查数以千计来自谷歌地图用户的错误报告,并根据需要进行修复。

工作人员可以手动将地图道路(左上)对准卫星图像

古普塔还展示了一张显示道路优先级的地图,线的宽度代表交通流量。谷歌一直用手机的位置信号映射交通条件。不过古普塔承认,位置信号也可以是其他信息的良好来源,比如转弯限制或者单行线。但他拒绝详细说明,“谷歌在很多地方使用了位置信息,但我不能谈论具体的东西。”

除了职业地图纠错团队,谷歌还得到来自MapMaker计划的帮助。2011年谷歌推出了普通用户可以参与的地图纠错项目,现在的该项目遍及220个国家。目标是提高谷歌地图在发展中国家和其他地区的准确度。因为在那里无法获得详细的地图源,“我们招募用户添加对于他们很重要的地图信息。我们会提供工具和卫星图像,因此他们可以很轻松的进行修正。”

用户可以提供公园、步道以及其他街景车无法进入的地方的信息。麦克伦登本人就曾帮助绘制Windy山的登山路径,“我用GPS记录了我登山的路径,完善了更多的精确路线。”

当你在笔记本电脑或手机上使用谷歌地图时,表面的信息之下隐藏着更多的数据。不只是道路的布局,还包括链接一个点到另一个点的逻辑信息。信息不只是建筑物的形状,也许未来谷歌地图只会不断的细节化。最终,呈现出来的可能是让人震惊的世界3D虚拟图像。

道路标志可利用算法从街景中提取,从而提供交通信息

摘自:网易科技

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-12-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【大咖来了】有道周枫:苹果Core ML对移动端深度学习的意义

【新智元导读】在WWDC2017(全球开发者大会)上,苹果发布了支持移动端深度学习的 CoreML 框架。网易有道 CEO 周枫指出,这个新框架能够解决以往云端...

43390
来自专栏数据科学与人工智能

【数据挖掘】这些年,这些挖掘机算法,这些反思

写这篇文章,缘自于前几天部门内部成员们进行了一次部门内部现有涉及的一些算法的review以及整理。不过比较囧的就是,由于boss不在,我们讨论讨论着就成了吐槽大...

28390
来自专栏大数据文摘

如何用数学知识提升情商?数学学霸们的6大思维习惯

18050
来自专栏大数据文摘

前沿 | MIT自动驾驶技术突破:实现浓雾中物体观测和测距,超人类水平

14360
来自专栏PPV课数据科学社区

【黑科技】数据分析师的秘密-QQ聊天记录分析(二)

? 承接上一篇文章,在上一篇中主要对群活跃情况,和成员情况进行了分析,这一篇则主要是对聊天记录做一些浅显的文本分析。 文本挖掘是一个博大精深的领域,我们通常叫...

43880
来自专栏PPV课数据科学社区

周一经典 | 如何成为一名数据科学家?

如何成为一名数据科学家? 文 | 谢科 "Data Science = statistics who uses python and lives in San ...

36950
来自专栏大数据文摘

前沿 | 国际可视化盛会PacificVis2017的十个精彩案例

31070
来自专栏人工智能头条

开玩乐,在移动端也能进行机器学习?做物体识别?TensorFlow on Android?

最近中美之间因为贸易战闹得很不愉快。美国非常鸡贼啊,掐死了高新科技这条路,这样一来我们依赖美国专利技术的行业就非常难受。但是,虽然美国这次做的很不地道,可也让我...

12230
来自专栏PPV课数据科学社区

【学习】关于数据挖掘算法的反思

 写这篇文章,缘自于前几天部门内部成员们进行了一次部门内部现有涉及的一些算法的review以及整理。不过比较囧的就是,由于boss不在,我们讨论讨论着就成了吐槽...

36250
来自专栏新智元

【AI快报】谷歌通用量子计算机获重要突破 |Dango用AI推荐表情符号

量子计算机 谷歌通用量子计算机获重要突破 “量子霸权”有机会成为现实 ? 来自加州圣芭芭拉谷歌研究实验室的计算机科学家,以及加州大学圣芭芭拉分校和西班牙巴斯克大...

36560

扫码关注云+社区

领取腾讯云代金券