首页
学习
活动
专区
工具
TVP
发布

敲厉害!就算你不知道自己在哪,AI也能把你带回家

高层速读

关键信息:加拿大蒙特利尔大学和Facebook FAIR实验室研发了一个神经网络系统,叫做Talk the Walk,它能够在不使用GPS的情况下给人提供简单的语言方向,在该实验中,两个机器人使用自然语言对话,让“导游bot”将“游客bot”带到指定地点,但Facebook称这是一项基础性的研究,并没有打算把它发布在地图产品中。

关键意义:致力于创造能够与人类一起工作以达到目标的人工智能。

对于分不清东西南北的同学来说,只知道左右,不知道方向,所以当别人问你在哪里时,我们只能回答说:“我在XX大厦的门口,对面是个超市……”

虽然现在大部分地图都会直接告诉你往哪边走,但是,如果存在一个机器人可以充当你的向导,它可以在你都不知道自己在哪的情况下为你导航,不需要GPS不需要知道南北,你还可以用跟普通人交流的方式跟它交流,是不是更便捷呢?

就像以下这样——

向导:你在哪啊?

游客:我面前有一家店叫“布鲁克斯兄弟”

向导:是商店?还是餐厅?

游客:是卖衣服的,我身后还有一家银行

向导:好的,左转然后沿那条路直走。

……

这是由加拿大蒙特利尔大学和Facebook FAIR实验室研发的导航神经网络系统,叫做Talk the Walk,它能够在不使用GPS的情况下给人提供简单的语言方向,在该神经网络系统中,人们可以通过自然的语言与AI进行交流,帮助人们找到正确的位置。

在这个实验中,会导航的“向导”和路痴“游客”都是由机器人(bot)扮演的。

向导bot可以看到地图,知道要游客bot需要达到的目标位置,但不知道游客在哪里;游客bot只能360度看到自己周围的世界,但不知道目的地在哪,也不知道要怎么达到;因此为了让游客顺利到达目标位置,二者需要通过交流协作才能达成目标

游客bot描述了他们看到的地标,比如“我就站在剧院旁边”,向导bot试图确定他们在哪里,它可以问问题,例如,它可能会问用户是否看到街角的商店帮助缩小范围。一旦它确定了用户的位置,它就会给出一个简单的语言响应,引导他们到达下一个路标点。

Facebook在纽约随机拍摄了很多张360度的街头照片,并将这些数据喂给了向导bot,向导可以将街景照片与地图位置相结合,所有信息了然于胸,从而对游客进行路线指导。在向导的指导下,游客可以根据要求观察周围的环境,以便让向导bot了解到游客的位置。

这是一个很新颖的实验,采用了一种叫做“嵌入式人工智能”的概念,在Talk the Walk中,向导bot拥有城市的2D地图数据,而游客机器人拥有丰富的360°可视化数据,但只有通过沟通才能执行指令。

怎么沟通呢?现实情况往往复杂很多,两个人在沟通路线时都不容易,何况是两个机器人?况且没有天生的“机器语”可供使用。

研究人员发现,当Bot使用更简单的符号来传达信息和位置时,完成任务的效果更好,这种交流方式被称作“合成语言”,这是一种数据通信方式,对机器人来说很管用。

研究人员提出了一个名为MASC(Masked Attention for Spatial Convolution)的机制,让Bot能快速从语言模型中解析对方回应的关键字的内容。Facebook表示,利用该流程可以使正在测试的结果的准确性翻倍。

这种交流方式也达到了该实验的真正目标:让Bot通过自然语言来处理收集到的信息。

对于Facebook来说,这是一项基础性的研究,它并没有打算把这些发布在地图产品中,所以该系统存在于一个长期的、不那么以产品为中心的领域。

分享这篇文章

与同仁共同探讨AI行业动向

往期文章

「AI商业报道」现已入驻

知乎号 | 头条号 | 百家号 | 网易号 | ZAKER

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180712B1QK5P00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券