赛尔推荐 第3期

该栏目每周将推荐若干篇由师生精心挑选的前沿论文,分周三、周五两次推送。

本次推荐了关于多任务学习、文本分类、阅读理解、特征选择、知识融合、图像标注等四篇论文。

1

推荐组:SA

推荐人:王帅(研究方向:情感分析)

论文题目:Adversarial Multi-task Learning for Text Classification

作者:Pengfei Liu, Xipeng Qiu and Xuanjing Huang

出处:ACL 2017

论文主要相关:多任务学习、文本分类

简评:常规的多任务学习通常单纯的共享某些参数,导致共用特征空间和私有特征空间中存在大量冗余的特征。本文提出一种多任务学习框架ASP-MTL,采用adversarial training确保共用特征空间中仅存在共用特征和任务无关的特征,辅以orthogonality constraints来去除私有和共用特征空间中冗余的特征。在16个任务的测试中,该框架比单任务学习平均效果提升了4.1%,比其他多任务学习框架(FS-MTL、 SP-MTL等)效果更好。

论文链接:

https://www.aclweb.org/anthology/P/P17/P17-1001.pdf

2

推荐组:SP

推荐人:李忠阳(博士课题研究方向:事理图谱,事件预测与推理)

[1]A Corpus and Cloze Evaluation for Deeper Understanding of Commonsense Stories

[2]Story Comprehension for Predicting What Happens Next

作者:

[1]Nasrin Mostafazadeh, Nathanael Chambers, Xiaodong He et al.

[2]Snigdha Chaturvedi, Haoruo Peng, Dan Roth

出处:

[1]NAACL-2016, University of Rochester

[2]EMNLP-2017, UIUC

论文主要相关:

[1]ROCStories Corpus, Story Cloze Test, Reading Comprehension

[2]Narrative Understanding, Feature Selection, Knowledge Fusion

简评:

[1]第一篇论文公开了一个数据集:ROCStories,训练集为98,161篇5句话组成的完整的小故事。开发集和测试集分别为1871篇小故事,每篇小故事包含4句话的上下文和2个候选故事结尾,其中只有1个是正确的结尾。任务目标是通过对故事上下文的精确理解、常识推理,从2个候选结尾中挑选出正确的那一个结尾。这篇论文同时也公布了一些基线方法,例如DSSM。该任务被称为Story Cloze Test。该任务同时也是LSDSem 2017的Shared Task,所以有很多新颖的方法出现。

[2]第二篇论文是目前ROCStories数据集上的最好结果(不排除有我未了解到的最新成果)。该工作没有高大上的神经网络模型, 方法偏传统,但是能给人以启发(原来还能这样操作!)。它挖掘了多方面的知识来帮助故事理解。这些知识包括事件序列(event-sequence)、情感路径(sentiment-trajectory)以及话题连贯性(topical-consistency)。然后,论文用一个隐变量模型(Hidden Coherence Model)将这三种知识融合在一起,取得了在故事结尾挑选任务上的最佳准确率,为77.6%。

论文链接:

[1]https://aclweb.org/anthology/N/N16/N16-1098.pdf

[2]https://aclweb.org/anthology/D/D17/D17-1168.pdf

数据集链接:

http://cs.rochester.edu/nlp/rocstories/

3

推荐组:TG

推荐人:孙卓(研究方向:文本生成)

论文题目:Skeleton Key: Image Captioning by Skeleton-Attribute Decomposition

作者:Yufei Wang, Zhe Lin, Xiaohui Shen, Scott Cohen, Garrison W. Cottrell

出处:CVPR 2017

论文主要相关:image caption

简评:这是一篇发表于CVPR 2017的论文,作者认为多数的语言模型都是逐个词的生成图像描述,但是对于人类来说,更自然的是先注意到图片中有哪些物体(对象)以及物体之间的关系,再来对物体的属性进行描述。文中提出一种由粗到精细的方法:将原始的图像描述分解为一个主干句skeleton以及物体的属性attribute,训练模型分别生成主干句及属性。此外,这种方法可以生成不同长度的图片描述结果,这得益于可以分别控制主干句以及属性的生成。

论文链接:

http://lanl.arxiv.org/pdf/1704.06972v1

(对话系统自动评价,优化器,复述生成,问答系统)

(词向量,情感分析,循环神经网络,sequence-to-sequence模型、选择机制和摘要生成)

(人机对话,神经网络模型,知识工程,自然语言推理,基于文档集的问答,sequence-to-sequence模型,预测的可解释性和机器翻译)

本期责任编辑:刘一佳

本期编辑: 孙 卓

“哈工大SCIR”公众号

主编:车万翔

副主编: 张伟男,丁效

责任编辑: 张伟男,丁效,赵森栋,刘一佳

编辑: 李家琦,赵得志,赵怀鹏,吴洋,刘元兴,蔡碧波,孙卓

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180328B0QC8K00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券