前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >「自然语言处理(NLP)」CQG增强动态推理网络(含源码)

「自然语言处理(NLP)」CQG增强动态推理网络(含源码)

作者头像
ShuYini
发布2019-08-21 15:40:36
5480
发布2019-08-21 15:40:36
举报

引言

两篇文章为大家介绍,第一篇针对会话问题产生,提出一种新的增强动态推理网络,该网络基于一般的编解码器动态的集成了一个推理过程,使得该网络可以更好地理解文章中提出的问题和接下来要问的问题。第二篇主要针对当前语义解释器直接将输入句子转换成逻辑形式的问题,提出使用生成验证框架来决此问题的方法,并且该方法性能比最先进的高出7.93%。

本文概要

1

First Blood

2

Double Kill

3

Aced

4

Attention

正文开始

1

First Blood

TILE: Reinforced Dynamic Reasoning for Conversational Question Generation.

Contributor : 浙江大学 && 俄亥俄州立大学

Paper: arxiv.org/pdf/1907.1266

Code: github.com/ZJULearning/

文章摘要

会话问题产生(CQG)是开发智能代理的关键,它可以驱动问答式对话或测试用户对给定段落的理解。为此,我们提出了一种新的增强动态推理(ReDR)网络,该网络基于一般的编解码器框架,并以动态的方式集成了一个推理过程,以更好地理解文章中提出的问题和接下来要问的问题。为了鼓励产生有意义的问题,我们利用一个流行的问题回答(QA)模型来提供反馈,并使用强化学习机制对问题生成器进行微调。

本文三大看点

1、提出了一种新的会话问题生成(CQG)任务,该任务对于开发智能代理来驱动问答式会话至关重要,并可能为未来相关研究提供有价值的数据集。

2、提出了一个新的有效的CQG框架,它配备了一个动态推理组件来生成会话问题,并通过强化学习机制进行了进一步的微调。

3、使用最新的CoQA数据集验证我们方法的有效性。此外,我们还使用它来创建多轮的QA会话,以显示其广泛的适用性。

网络模型介绍

增强动态推理(ReDR)网络架构。

由于一个完成的段落太长,很难专注于在最相关信息下生成一个问题,我们的方法:是首先从文章中选择一个文本跨度作为每个会话转折点,然后在最终解码下一个问题之前,动态的为编码会话历史以及选择的基本理论建模。其中推理机制迭代地读取会话历史,在每次迭代中,它的输出通过一个软决策者(pd)作为新的编码表示动态地与之前的编码表示相结合,并将其反馈到下一个迭代中。最后,通过由QA模型预测的答案的质量所定义的奖励对模型进行微调。

试验结果

CoQA数据集上各种模型的性能比较

人工评价结果

CoQA数据集中生成问题和人工注释问题统计对比

基于CoQA数据集,模型生成问题和人工问题生成样例

2

Double Kill

TILE: A Generate-Validate Approach to Answering Questions about Qualitative Relationships

Contributor : University of Washington(华盛顿大学)

Paper: arxiv.org/pdf/1908.0364

Code: None

文章摘要

最近提出了一个涉及定性关系的问题回答数据集,并探索了几种回答此类问题的方法,其核心依赖语义解释器将自然语言输入转换为合适逻辑形式。现有语义解释器的一个问题是,它们试图直接将输入的句子转换成逻辑形式。由于输出语言随应用程序的不同而不同,它迫使语义解析器从头开始学习几乎所有内容。在本文中,提出应用生成验证框架,生成逻辑形式的自然语言描述,并验证输入文本是否遵循自然语言描述,我们得到了一个更好的学习范围,我们的方法性能比最先进高出7.93%。

本文两大看点

1、指出了如何应用生成验证框架来解决Quarel的定性单词问题;

2、我们通过实验表明,现有的自然语言推理数据集,即snli和像bert这样的预先训练的模型,可以显著提高Quarel的性能,而不是直接生成逻辑形式,语义分析是通过生成验证来完成的。 本文方法的精度为76.63%,比Quasp+模型高7.93%,比Quasp模型高20.53%。

方法介绍

1、生成: 所有可能的基于QVAL谓词的自然语言描述集,其中一些是给定的事实、ClaimA和ClaimB。

2、验证:步骤2的目标是准确地确定

中的哪个陈述是ClaimA,哪个陈述属于ClaimB,哪个陈述代表给定的事实。 为此,系统使用两个不同的文本包含函数对

中的语句进行评分。

3、使用步骤2中计算的分数计算最终答案。。

实验结果

在QUAREL训练集和测试集上选择不同

得到的准确率对比。

将我们的最佳模型与现有的Quarel解析器进行比较 。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AINLPer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章摘要
  • 本文三大看点
  • 网络模型介绍
  • 试验结果
  • 文章摘要
  • 本文两大看点
  • 方法介绍
  • 实验结果
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档