首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

谷歌:即使用了人工智能学习,仍有需要人力帮忙制作地图空间

不少网站防止僵尸程序攻击的机制采用 验证码,要你辨识图像中的数字与文字,从而分辨人类与 僵尸程序。但你知道吗,这些人类顺手之劳的打打字小工作,不少次是帮助 Google 地图做机器学习,辨识街景中出现的门牌与路名。

即便像 Google 这类大量依靠机器学习的公司,仍有不少地方要靠人工去做,要靠大量的人力协助辨识门牌、路名区块中,里面出现的数字或是文字。Google 地图软件工程师比尔 表示,不只是 Google 地图采用机器学习的问题,这是整体机器学习技术领域遇到的挑战。长远的目标会是减少涉入的人力,但又不会破坏建立的模型,仍然能用既有模型去跑。

比尔 说采用深度学习处理计算机视觉板题,是相当高难度的事情,街景车每天上街拍摄的照片数量相当庞大,但仍然需要有方式处理。一般人很快就能辨识出门牌及街上路牌上的路名,用深度学习则是挑战。Google 地图采用递归神经网络,找出街景车拍摄的照片,辨识不同角度照片中出现的路牌信息,从中截取需要的路名或是门牌信息。

尼日利亚的拉哥斯,Google 运用机器学习找出建筑的门牌号码。

商家的店面入口除了店名之外,还有贩卖产品信息、特价优惠等文字。上述信息也许当地人能找出店家叫什么,但对于机器来说,以及远在天边并不是当地人,训练 AI 的工程师来说,是相当有挑战性的事情。Google 地图团队运用注意力机制,从街景车拍摄的店面,找出人类视觉集中之处,从而判断店家店名。

运用递归神经网络,训练算法辨识不同角度拍的影像,路牌上的路名。

路名常用缩写表示,而对当地人来说,很容易还原完整的路名,但机器就未必了。比尔 说他们会对路名做规范化工作,处理路名中的缩写,像是 Av. 代表 Avene,Pres. 则是 President 的缩写。

运用注意力机制,模仿人类视觉焦点,从而找出影像中的商家店名。

比尔 还提及 Google 地图整合经机器学习方式绘制的 1.1 亿栋建筑外框,补充说道没有特定加某个地方的建筑,而是看那个地方影像适合他们模型,能得到最好的结果。

Google 运用机器学习,最终加了 1.1 亿建筑到 Google 地图上。

Google 街景车当初推出是相当大的噱头,但如今是喂养 Google 机器学习模型的庞大数据。当被问到街景影像以及卫星图辨识的问题,比尔 说影像如有遮荫,会增加辨识建筑物的困难度。

比尔 谈到用机器学习处理地图信息,技术本身是其次,而是要怎么将不断变动的现实世界,相关变动反映到地图,而且尽可能缩短地图数据处理时间。更快速的反映现实变化的地图,比尔 说这是他们的团队一直在努力的方向。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180912A1M9RU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券