前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ACL最佳论文出炉,十四行诗生成、OpenNMT、概率类型学等上榜

ACL最佳论文出炉,十四行诗生成、OpenNMT、概率类型学等上榜

作者头像
量子位
发布2018-03-28 14:45:03
9980
发布2018-03-28 14:45:03
举报
文章被收录于专栏:量子位
李林 编译出品 量子位 报道 | 公众号 QbitAI

今天,2017年度计算语言学协会年会(ACL)评出了5篇最佳…论文,量子位整理介绍如下:

最佳演示论文:

Marjan Ghazvininejad, Xing Shi, Jay Priyadarshi, Kevin Knight, Hafez: an interactive poetry generation system

论文: http://xingshi.me/data/pdf/ACL2017demo.pdf

代码: https://github.com/shixing/poem

这篇论文描述了一个由循环神经网络(RNN)和有限状态接收器(Finite State Acceptor, FSA)构成的自动诗歌生成系统“Hafez”,可以根据任意主题生成十四行诗。用户还能通过调整风格配置,来修改、润色这些诗歌。

论文的四位作者是南加州大学武凯文(Kevin Knight)教授和他的学生Marjan Ghazvininejad、史兴、Jay Priyadarshi。

他们去年就在EMNLP上发表了一篇生成诗歌的论文:Generating Topical Poetry; Marjan Ghazvininejad,还把诗歌生成软件做成了一个Alexa Skill(https://www.amazon.com/USC-Custom-Poetry/dp/B06X9HNFGC)以及一个网页Demo(http://52.24.230.241/poem/)

最佳演示论文第二名:

Guillaume Klein、Yoon Kim、Yuntian Deng、Jean Senellart、Alexander Rush OpenNMT: Open-Source Toolkit for Neural Machine Translation

论文: https://arxiv.org/abs/1701.02810

项目主页: http://opennmt.net/

代码: https://github.com/OpenNMT/OpenNMT

这篇论文由哈佛大学和机器翻译公司SYSTRAN联合发表,他们的OpenNMT是一个开源的神经机器翻译系统。

最佳资源论文:

Alane Suhr, Mike Lewis, James Yeh, Yoav Artzi, A Corpus of Natural Language for Visual Reasoning

论文: http://yoavartzi.com/pub/slya-acl.2017.pdf

项目主页: http://lic.nlp.cornell.edu/nlvr/

数据集: https://github.com/clic-lab/nlvr

这篇论文由康奈尔大学和Facebook AI研究院共同发表,给出了一个新的视觉推理语言数据集,其中包括92244对自然语言陈述和生成图片,以及3962个句子。

ACL 2017的程序委员会这样评价这篇论文:

我很欣赏这篇论文中的sanity check,它确保了在不理解这些数据集的情况下,无法解决相关问题。

最佳短论文:

Bogdan Ludusan, Reiko Mazuka, Mathieu Bernard, Alejandrina Cristia, Emmanuel Dupoux, The Role of Prosody and Speech Register in Word Segmentation

论文: http://aclweb.org/anthology/P17-2028

这篇论文由法国巴黎高等师范学院、法国高等社会科学院和日本理化学研究所共同完成,探索了语体和韵律在段词中的作用,结果显示,语体的作用比此前热门所认为的要小,而韵律边界信息在成人语言中比在婴儿语言中发挥着更大的作用。

众所周知,把研究结果写成短论文很难。在委员们推荐的论文中,只有这一篇符合程序委员会的“最佳短论文”标准:

(a)是作为短论文而写的,不是省略了细节的长论文; (b)包含论文中应该包含的所有元素; (c)作为一篇短论文,它是“最好的”。

最佳长论文:

Ryan Cotterell, Jason Eisner, Probabilistic Typology: Deep Generative Models of Vowel Inventories

论文地址: https://arxiv.org/abs/1705.01684

这篇论文来自康奈尔大学,将统计学方法引入类型学研究,用来解答这个经典的问题:一个自然的元音清单的如何形成的?

语言类型学研究人类语言中的各种不同结构,探索哪些结构、现象是各种语言的共性,哪些是很少出现的。元音清单就是其中的问题之一:所有语言都有元音,但并不是所有语言都包含u这个音。

程序委员会将这篇论文选为“最佳长论文”,是因为它将“古典”生成模型和神经网络结合起来,探索负责的语言学问题。

论文的第一评审这样评价它:

我对这篇文章印象深。它以微妙而恰当的方式使用了现代的深度学习工具。这篇论文为了达到前人方法未能完成的明确目标,而进行了计算。 现在,我们可以评估一个完整的元音清单出现的概率,而不再局限于根据一个元音来猜测另一个元音出现的可能性。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-08-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 李林 编译出品 量子位 报道 | 公众号 QbitAI
相关产品与服务
机器翻译
机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档