学界 | FAIR 实验室的 ICLR 2017:理解对话是一场漫长的博弈

AI科技评论按:在 ICLR 2017 举办之际,FAIR实验室撰文展示了团队在理解对话所做的研究和贡献,AI科技评论进行编译,未经许可不得转载。

建立一个有效的对话系统

在 Facebook 的人工智能研究中心(FAIR),理解对话一直被认为是一个宏大和长期的 AI 研究目标。

一个真正有效的对话系统应该是一项辅助性的技术,这个系统很可能包括一个可以用自然语言与人类交流的与聊天机器人类似的系统。它可以帮助人们更好地理解周围的世界,更有效地和周围的人进行交流,消除沟通上的障碍。随着数字化内容的不断增多,研发此类技术将会变得越来越重要。

尝试着去理解和解释对话并不是一个新奇的想法。早在 20 年前,就有人尝试着去建造一台人类可以与之交流并且可以教它学习如何去对话的机器。它们结合了技术和工程,但是使用预编程的脚本响应就显得视野十分狭窄了。

多亏了近年来机器学习技术的发展,机器学习技术让 AI 智能体与人类用自然语言交流成为了一个更加现实的想法,得到了学术界和工业界的广泛关注。

然而,现在的大多数对话系统仍然是脚本化的:它们的自然语言理解的模块可能是基于机器学习的,但是它们的应答内容通常是由 if/then 语句或规则引擎来决定的。尽管相对于数十年前已经取得了进步,但是在很大程度上还是依据其巨大的文本数据库来创建它们的回答。

应对两端的挑战

与聊天机器人进行自然语言的对话仍然是一个挑战,这将需要一系列研究上的突破。 FAIR 选择从两个方向来解决这个问题:一般的 AI 和机器通过交流进行推理以及在当前的对话系统中进行研究。并从实际使用的聊天机器人中吸取经验。 FAIR 的优势在于跨越两种方法的所遇到的多样性。从长期的类似于 CommAI intiative 的基础性研究,到短期的类似于 FastText 和 Facebook M 的应用型尝试。通过这些努力,再加上团队在 AI 频谱、从深度学习 NLP 到增强学习、计算机视觉和工程方面的专业知识, FAIR 希望能够取得有意义的自然语言对话进展。

FAIR 在对话方面工作的重要一点是, 团队如何将它置于一个明确的基础之中:

  • 强大的基础: 针对于 NLP 问题的高级学习系统应该展现出比传统方法更好地性能。为了达到这个目的, FAIR 构建了 FastText, 用相对简单和容易理解的技巧来提供可达到的最佳效果。
  • 清晰的评估:评价一个对话系统是一个很困难的问题。FAIR 提出了一个更好的工具来做到这一点。在 ICLR 2017,Facebook 与学术界分享了它们的发现和工具。其中包括训练和评估推理模型的 CommAI environment,以及可用于测试端对端对话模型的 bAbI. 由于 FAIR 与 Facebook M 的合作,这些工具已经在实际生产条件下进行了测试。
  • 开放的研究:FAIR 通过会议或者预印的方式公开了其几乎所有的研究工作。同样地,代码和数据,包括上面提到的两个评估举措也作为开放源码发布了。正如在 FAIR 有多种多样的工作一样,AI 社区也有着极大的多样性。 FAIR 相信通过开放式的对话、共享工具和研究将会带来更大的进步。

通过共享知识来获取进步

在 ICLR, FAIR 提供了 7 篇论文来说明 FAIR 对话研究的质量、创新和广度。Lazaridou 等人 [6] 和 CommAI 团队 [1] 提出了使系统能够发现和使用基本沟通技巧的方向,是迈向强人工智能的第一步。Li 等人提出了 2 篇关于端对端对话系统如何使用现场对话来提升自身性能的论文 [2,5]。Bordes 等人将 bAbI 引入到面向目标场景中的端对端对话系统的测试。 FAIR 也展示了 Grave 等人和 Henaff 等人关于机器阅读的两篇论文,他们的研究实现了通过机器推动文本阅读的界限。

参考文献

[1] CommAI: Evaluating the First Steps Towards a Useful General AI, M Baroni, A Joulin, A Jabri, G Kruszewski, A Lazaridou, K Simonic, T Mikolov

[2] Dialogue Learning With Human-In-The-Loop, J Li, AH Miller, S Chopra, MA Ranzato, J Weston

[3] Improving Neural Language Models with a Continuous Cache, E Grave, A Joulin, N Usunier

[4] Learning End-to-end Goal-oriented Dialog, A Bordes, YL Boureau, J Weston

[5] Learning Through Dialogue Interactions, J Li, AH Miller, S Chopra, MA Ranzato, J Weston

[6] Multi-Agent Cooperation and the Emergence of (Natural) Language, A Lazaridou, A Peysakhovich, M Baroni

[7]「Tracking the World State with Recurrent Entity Networks,」M Henaff, J Weston, A Szlam, A Bordes, Y LeCun

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-04-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏MixLab科技+设计实验室

智能时代之前,我们一直在量化世界-01

这是mixlab无界社区的成员Jeff的《如何让机器量化知识》系列文章的第01篇。为我们介绍知识的数据化、量化,以及如何把开放的问题转化为封闭式问题让机器解读。

481
来自专栏机器人网

众包:让机器人学习的更快更好

华盛顿大学计算机科学家最近展示了众包如何快速高效教育机器人完成任务。机器人将不再只是从一个人身上学习,而是有可能在更大范围的在线社区内,询问摆放餐具或者为花园浇...

2514
来自专栏华章科技

AI取代人类?这4种工作仍将是从业者的“铁饭碗” | 未来

导读:围棋人机大战、人脸识别、自动驾驶、智能控制、语言和图像理解……这些年,人工智能的威力,我们已经见识过太多。“人工智能”甚至入选“2017年度中国媒体十大流...

844
来自专栏PPV课数据科学社区

被玩儿坏的概念:微信朋友圈广告真的用上了大数据?

?   被玩儿坏的概念——微信朋友圈广告真的用上了大数据?   微信朋友圈广告的事儿过去几天了,眼看各路大神一波一波的评述事件,在揣摩数篇大作后,有两个问题值...

3404
来自专栏杨建荣的学习笔记

技术学习的一些建议

所以我们总是在不断的学习中,这个技能的迭代速度早就远超大学的学习内容。相比来说,现在我们学习更加追求高效和通俗,即学到的技能相同,但是学习的内容能用大白...

1002
来自专栏机器之心

学界 | 一文概览语音识别中尚未解决的问题

3066
来自专栏ATYUN订阅号

谷歌利用AI管控数据中心冷却系统以降低能耗

AI正在管控谷歌的一个数据中心,或者至少可以说是数据中心的冷却系统。谷歌今天在一篇博客文章中表示,它已将冷却控制管理转交给与DeepMind共同开发的AI推荐系...

914
来自专栏达观数据

新年将至,沉睡的文本数据也该醒醒了

随着企业收集的非结构化数据不断增加,文本智能处理的价值和流行趋势也处于上升阶段。越来越多的企业意识到利用文本挖掘从企业文本资源库中提取知识和提升效率的重要性。 ...

3917
来自专栏数据科学与人工智能

【数据挖掘】金融行业的数据挖掘之道

工商银行文本挖掘技术应用探索分享 工商银行在大家传统的印象当中是一个体形非常庞大但是稳步前行的形象,但是近些年来在大数据的挑战下工商银行积极应对外界变化,做一些...

2425
来自专栏华章科技

如何真正学好数据科学?

作为一个全新的领域,数据科学的飞速发展让人激动。数据科学在带来巨大经济效益的同时,人们在数据科学技术方面的知识沟也逐渐出现,这意味着更多的人需要试图了解和学习数...

522

扫码关注云+社区