ACL最佳论文出炉，十四行诗生成、OpenNMT、概率类型学等上榜

量子位

发布于 2018-03-28 14:45:03

1K0

发布于 2018-03-28 14:45:03

文章被收录于专栏：量子位

李林编译出品量子位报道 | 公众号 QbitAI

今天，2017年度计算语言学协会年会（ACL）评出了5篇最佳…论文，量子位整理介绍如下：

最佳演示论文：

Marjan Ghazvininejad, Xing Shi, Jay Priyadarshi, Kevin Knight, Hafez: an interactive poetry generation system

论文： http://xingshi.me/data/pdf/ACL2017demo.pdf

代码： https://github.com/shixing/poem

这篇论文描述了一个由循环神经网络（RNN）和有限状态接收器（Finite State Acceptor, FSA）构成的自动诗歌生成系统“Hafez”，可以根据任意主题生成十四行诗。用户还能通过调整风格配置，来修改、润色这些诗歌。

论文的四位作者是南加州大学武凯文（Kevin Knight）教授和他的学生Marjan Ghazvininejad、史兴、Jay Priyadarshi。

他们去年就在EMNLP上发表了一篇生成诗歌的论文：Generating Topical Poetry; Marjan Ghazvininejad，还把诗歌生成软件做成了一个Alexa Skill（https://www.amazon.com/USC-Custom-Poetry/dp/B06X9HNFGC）以及一个网页Demo（http://52.24.230.241/poem/）

最佳演示论文第二名：

Guillaume Klein、Yoon Kim、Yuntian Deng、Jean Senellart、Alexander Rush OpenNMT: Open-Source Toolkit for Neural Machine Translation

论文： https://arxiv.org/abs/1701.02810

项目主页： http://opennmt.net/

代码： https://github.com/OpenNMT/OpenNMT

这篇论文由哈佛大学和机器翻译公司SYSTRAN联合发表，他们的OpenNMT是一个开源的神经机器翻译系统。

最佳资源论文：

Alane Suhr, Mike Lewis, James Yeh, Yoav Artzi, A Corpus of Natural Language for Visual Reasoning

论文： http://yoavartzi.com/pub/slya-acl.2017.pdf

项目主页： http://lic.nlp.cornell.edu/nlvr/

数据集： https://github.com/clic-lab/nlvr

这篇论文由康奈尔大学和Facebook AI研究院共同发表，给出了一个新的视觉推理语言数据集，其中包括92244对自然语言陈述和生成图片，以及3962个句子。

ACL 2017的程序委员会这样评价这篇论文：

我很欣赏这篇论文中的sanity check，它确保了在不理解这些数据集的情况下，无法解决相关问题。

最佳短论文：

Bogdan Ludusan, Reiko Mazuka, Mathieu Bernard, Alejandrina Cristia, Emmanuel Dupoux, The Role of Prosody and Speech Register in Word Segmentation

论文： http://aclweb.org/anthology/P17-2028

这篇论文由法国巴黎高等师范学院、法国高等社会科学院和日本理化学研究所共同完成，探索了语体和韵律在段词中的作用，结果显示，语体的作用比此前热门所认为的要小，而韵律边界信息在成人语言中比在婴儿语言中发挥着更大的作用。

众所周知，把研究结果写成短论文很难。在委员们推荐的论文中，只有这一篇符合程序委员会的“最佳短论文”标准：

（a）是作为短论文而写的，不是省略了细节的长论文; （b）包含论文中应该包含的所有元素；（c）作为一篇短论文，它是“最好的”。

最佳长论文：

Ryan Cotterell, Jason Eisner, Probabilistic Typology: Deep Generative Models of Vowel Inventories

论文地址： https://arxiv.org/abs/1705.01684

这篇论文来自康奈尔大学，将统计学方法引入类型学研究，用来解答这个经典的问题：一个自然的元音清单的如何形成的？

语言类型学研究人类语言中的各种不同结构，探索哪些结构、现象是各种语言的共性，哪些是很少出现的。元音清单就是其中的问题之一：所有语言都有元音，但并不是所有语言都包含u这个音。

程序委员会将这篇论文选为“最佳长论文”，是因为它将“古典”生成模型和神经网络结合起来，探索负责的语言学问题。

论文的第一评审这样评价它：

我对这篇文章印象深。它以微妙而恰当的方式使用了现代的深度学习工具。这篇论文为了达到前人方法未能完成的明确目标，而进行了计算。现在，我们可以评估一个完整的元音清单出现的概率，而不再局限于根据一个元音来猜测另一个元音出现的可能性。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-08-03，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自量子位微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度