ACL最佳论文出炉,十四行诗生成、OpenNMT、概率类型学等上榜

李林 编译出品 量子位 报道 | 公众号 QbitAI

今天,2017年度计算语言学协会年会(ACL)评出了5篇最佳…论文,量子位整理介绍如下:

最佳演示论文:

Marjan Ghazvininejad, Xing Shi, Jay Priyadarshi, Kevin Knight, Hafez: an interactive poetry generation system

论文: http://xingshi.me/data/pdf/ACL2017demo.pdf

代码: https://github.com/shixing/poem

这篇论文描述了一个由循环神经网络(RNN)和有限状态接收器(Finite State Acceptor, FSA)构成的自动诗歌生成系统“Hafez”,可以根据任意主题生成十四行诗。用户还能通过调整风格配置,来修改、润色这些诗歌。

论文的四位作者是南加州大学武凯文(Kevin Knight)教授和他的学生Marjan Ghazvininejad、史兴、Jay Priyadarshi。

他们去年就在EMNLP上发表了一篇生成诗歌的论文:Generating Topical Poetry; Marjan Ghazvininejad,还把诗歌生成软件做成了一个Alexa Skill(https://www.amazon.com/USC-Custom-Poetry/dp/B06X9HNFGC)以及一个网页Demo(http://52.24.230.241/poem/)

最佳演示论文第二名:

Guillaume Klein、Yoon Kim、Yuntian Deng、Jean Senellart、Alexander Rush OpenNMT: Open-Source Toolkit for Neural Machine Translation

论文: https://arxiv.org/abs/1701.02810

项目主页: http://opennmt.net/

代码: https://github.com/OpenNMT/OpenNMT

这篇论文由哈佛大学和机器翻译公司SYSTRAN联合发表,他们的OpenNMT是一个开源的神经机器翻译系统。

最佳资源论文:

Alane Suhr, Mike Lewis, James Yeh, Yoav Artzi, A Corpus of Natural Language for Visual Reasoning

论文: http://yoavartzi.com/pub/slya-acl.2017.pdf

项目主页: http://lic.nlp.cornell.edu/nlvr/

数据集: https://github.com/clic-lab/nlvr

这篇论文由康奈尔大学和Facebook AI研究院共同发表,给出了一个新的视觉推理语言数据集,其中包括92244对自然语言陈述和生成图片,以及3962个句子。

ACL 2017的程序委员会这样评价这篇论文:

我很欣赏这篇论文中的sanity check,它确保了在不理解这些数据集的情况下,无法解决相关问题。

最佳短论文:

Bogdan Ludusan, Reiko Mazuka, Mathieu Bernard, Alejandrina Cristia, Emmanuel Dupoux, The Role of Prosody and Speech Register in Word Segmentation

论文: http://aclweb.org/anthology/P17-2028

这篇论文由法国巴黎高等师范学院、法国高等社会科学院和日本理化学研究所共同完成,探索了语体和韵律在段词中的作用,结果显示,语体的作用比此前热门所认为的要小,而韵律边界信息在成人语言中比在婴儿语言中发挥着更大的作用。

众所周知,把研究结果写成短论文很难。在委员们推荐的论文中,只有这一篇符合程序委员会的“最佳短论文”标准:

(a)是作为短论文而写的,不是省略了细节的长论文; (b)包含论文中应该包含的所有元素; (c)作为一篇短论文,它是“最好的”。

最佳长论文:

Ryan Cotterell, Jason Eisner, Probabilistic Typology: Deep Generative Models of Vowel Inventories

论文地址: https://arxiv.org/abs/1705.01684

这篇论文来自康奈尔大学,将统计学方法引入类型学研究,用来解答这个经典的问题:一个自然的元音清单的如何形成的?

语言类型学研究人类语言中的各种不同结构,探索哪些结构、现象是各种语言的共性,哪些是很少出现的。元音清单就是其中的问题之一:所有语言都有元音,但并不是所有语言都包含u这个音。

程序委员会将这篇论文选为“最佳长论文”,是因为它将“古典”生成模型和神经网络结合起来,探索负责的语言学问题。

论文的第一评审这样评价它:

我对这篇文章印象深。它以微妙而恰当的方式使用了现代的深度学习工具。这篇论文为了达到前人方法未能完成的明确目标,而进行了计算。 现在,我们可以评估一个完整的元音清单出现的概率,而不再局限于根据一个元音来猜测另一个元音出现的可能性。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-08-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

教程 | 如何通过Scikit-Learn实现多类别文本分类?

3939
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/5/13

1. Google I/O召开大会,个人觉得最有意思的是TPU 3.0和AI冒充真人打电话

1265
来自专栏ATYUN订阅号

【行业】AR走进医疗:谷歌打造增强现实显微镜平台实时检测癌症

在眼科学、皮肤学、放射学和病理学等医学学科领域,深度学习前景广阔,可以用于提高世界各地患者高质量医疗保健的准确性和实用性。

803
来自专栏AI研习社

Kaggle 机器学习之模型融合(stacking)心得

此文道出了本人学习 Stacking 入门级应用的心路历程。 在学习过程中感谢 @贝尔塔的模型融合方法(http://t.cn/R62UGLF),以及如何在 K...

4366
来自专栏CDA数据分析师

如何利用 Excel 进行高级数据分析?

高级的数据分析会涉及回归分析、方差分析和T检验等方法,不要看这些内容貌似跟日常工作毫无关系,其实往高处走,MBA的课程也是包含这些内容的,所以早学晚学都得学,干...

2228
来自专栏Python中文社区

Kaggle搭积木式刷分大法:特征工程部分

專 欄 ❈本文作者:王勇,目前感兴趣项目商业分析、Python、机器学习、Kaggle。17年项目管理,通信业干了11年项目经理管合同交付,制造业干了6年项目...

7199
来自专栏ATYUN订阅号

研究团队探索如何让AI学会自己穿衣服

在Siggraph 2018论文“Learning to Dress: Synthesizing Human Dressing Motion via Deep ...

1195
来自专栏IT派

推荐|Kaggle机器学习之模型融合(stacking)心得

此文道出了本人学习Stacking入门级应用的心路历程。 在经过了几天漫长的查询资料和整理,脑子不好,理解顿悟花了不少时间。在学习过程中感谢@贝尔塔的模型融合...

4545
来自专栏深度学习与数据挖掘实战

【AI头条&优质资源】时间序列预测模型:使用深度神经网络RNN+Attention机制

放arxiv那天看了一下,整篇paper思路读下来还是非常清晰的,实验效果也很不错。

2922
来自专栏罗晖的专栏

使用 Q-Learning 实现 FlappyBird AI

Q-Learning 是一种 off-policy 的强化学习算法, 本文介绍如何使用 Q-Learning 来实现FlappyBird 游戏的 AI,附件中给...

1.1K0

扫码关注云+社区