模拟电话问路 — Facebook用一对机器人进行导航训练

编译:chux

出品:ATYUN订阅号

Facebook人工智能研究人员创建了一对人工智能系统,能够使用360度图像,自然语言以及包含银行和餐馆等当地标志的地图在纽约市的街道上进行导航。名为Talk the Walk的研究任务和数据集是开源的,同时也开放了在Arxiv上发布的现实世界训练的初步结果。这项研究包括人工智能系统如何定位自己并比人类更好地传达观测数据。

两个AI系统经过训练,可以完成两项具体任务:游客机器人必须向导游机器人描述其周围环境,然后导游机器人根据地图的描述并使用自然语言来确定其位置,成功率达到88%。

将游客机器人扔到纽约市的一个随机街角,再由导游机器人将他们引导到2D地图上的某个位置。导游机器人知道地图和目标位置但不知道游客机器人在哪。

“这与其他数据集区别开来的是我们有实际的自然语言注释,所以它不是其他人都尝试过的某种人工模板化的语言。这是第一个真实视觉感知的真实语言,”Facebook AI研究科学家Douwe Kiela表示。

Talk the Walk涉及两个人工智能系统,包括曼哈顿的地狱厨房,东村,金融区和上东区以及布鲁克林的威廉斯堡附近。

更复杂的是,每一个社区都遵循一个网格系统,所以地图没有独特的品质。一个有16个不同街角的两个街区的半径看起来很小;然而,最初的研究范围,但之后必须减少,因为事实证明,人类很难完成。

视频内容

Kiela指出,“这是一项重要的任务,因为它汇集了许多不同的挑战,如果我们想要在人工智能研究方面取得进展,我们需要解决这些挑战,例如逼真的360度视觉感知,基于地图的导航,视觉推理,通过对话进行的自然语言交流,所有这些对于解决AI问题都很重要。而这项工作的目的是试图将所有这些问题结合起来,形成一种全面的,无所不包的解决方案。”

虽然360度视频和地图是训练系统输入的一部分,但任务和基准数据集主要面向对话AI推进,工作集中在基础,使用多模式方法开发自然语言的实践理解。

为了达到彼此需要成功的沟通,无论是游客告诉导游哪里有自然语言和必须解释旅游智能体产生的文字的指南。

Kiela表示,“这种研究的长期愿景是提高对自然语言的理解,因此当然这对人类来说很有意义。基本上,如果我们能够实现代理人真正理解自然语言的人工智能,那么对于AI来说这将是一个关键时刻,我真的非常关心这个长期愿景,首先是我们如何才能达到这种语言理解,我们怎样才能让AI真正拥有这种迄今为止一直缺失的常识。”

一种名为Masked Attention for Spatial Convolution(MASC)的注意机制被用于缩小智能体的焦点。它基本上支持代理运行的这些语言模型,以快速解析关键字在响应中的内容。Facebook表示,利用该流程可以使正在测试的结果的准确性翻倍。

生成的任务和数据集可作为基准。这项工作是开源的,AI社区成员可以利用它们推进机器对人类沟通技巧的理解。

“这是一项艰巨的挑战,这也是我们开源的原因之一,总的来说,我们应该在人工智能研究中挑战更多的困难,以及社区难以解决的问题,认清我们目前可以做的事情的局限性。因此,开源的事情对我们很重要。”

论文:arxiv.org/abs/1807.03367

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-07-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏镁客网

谷歌宣布开放Cloud TPU,每小时6.5美元,英伟达还坐得住吗?

1372
来自专栏机器之心

学界 | Facebook ICLR 2017研究成果概述,对话研究的创新与优势

选自Facebook 作者:Alexandre Lebrun等 参与:李泽南、微胖 深度学习盛会 ICLR 2017 正在法国的土伦举行,Facebook 在大...

2747
来自专栏企鹅号快讯

机器学习和深度学习概念入门(上)

目 录 1人工智能、机器学习、深度学习三者关系 2什么是人工智能 3什么是机器学习 4机器学习之监督学习 5机器学习之非监督学习 6机器学习之半监督学习 7机...

2138
来自专栏数据科学与人工智能

【机器学习】你应该知道的机器学习方法

决定何时以及如何在你的团队中使用AI技术是一项艰巨的任务。可选的技术比比皆是:据venturescanner.com网站显示,目前VCs给多达885家AI公司投...

3116
来自专栏CDA数据分析师

数据分析与数据挖掘的联系和区别!

数据挖掘挖什么? 前一篇我总结了一些软件的区别和选择。在数据分析的学习道路上,放正了心态(心术篇),扎实了基础(理论篇),熟练了工具(软件篇...

2775
来自专栏新智元

【专访微软黄学东】0.1%,0.2%与0.3%,语音识别军备竞赛中小数点差距有何意义

【新智元导读】 微软语音识别研究团队在黄学东的带领下,去年将语音识别的单词错误率降至5.9%,又在最近降至5.1%。在本次专访中,我们讨论了语音识别错误率百分之...

3117
来自专栏AI研习社

一篇文章告诉你如何成为数据科学家

通常来说,年轻人都很容易立志成为什么,例如成为一名科学家,然后又很快放弃。这一方面是因为摆在他们面前的诱惑太多,同时也因为成为一名科学家真的很不容易。 这一点放...

3479
来自专栏人工智能头条

AAAI主席Rao Kambhampati:破解人机共存的规划技术挑战(PPT下载)

1333
来自专栏AI研习社

从 1 数到 13,想当数据科学家的你这些错误可别犯

当你看这篇文章的时候,我们知道你已经决定把数据科学当作你的工作。当下越来越多的企业需要数据支持其决策,世界也变得越来越紧密,几乎每个企业都需要大量的数据科学实践...

773
来自专栏大数据文摘

败家还是持家?看你懂不懂购物算法!

32310

扫码关注云+社区

领取腾讯云代金券