专栏首页arxiv.org翻译专栏在线论坛对话中的匹配问答(CS CL)
原创

在线论坛对话中的匹配问答(CS CL)

在对话中两转发服务器之间匹配问答关系,不仅是分析对话结构的第一步,而且对于训练对话系统也很有价值。本文提出了一种QA匹配模型,该模型同时考虑了距离信息和对话历史记录,这是通过相互注意机制(mutual attention)实现的。给定由训练后的模型在每个非问题转发及其候选问题之间计算出的分数,将贪婪匹配策略用于最终预测。由于现有的对话数据集(例如Ubuntu数据集)不适合QA匹配任务,因此我们进一步创建了包含1,000个带标签的对话数据集,并证明了我们提出的模型优于最新技术和其他强大的基线(baseline),尤其是在匹配长距离QA对时。

在对话中两转发服务器之间匹配问答关系,不仅是分析对话结构的第一步,而且对于训练对话系统也很有价值。本文提出了一种QA匹配模型,该模型同时考虑了距离信息和对话历史记录,这是通过相互注意机制(mutual attention)实现的。给定由训练后的模型在每个非问题转发及其候选问题之间计算出的分数,将贪婪匹配策略用于最终预测。由于现有的对话数据集(例如Ubuntu数据集)不适合QA匹配任务,因此我们进一步创建了包含1,000个带标签的对话数据集,并证明了我们提出的模型优于最新技术和其他强大的基线(baseline),尤其是在匹配长距离QA对时。

原文题目:Matching Questions and Answers in Dialogues from Online Forums

原文:Matching question-answer relations between two turns in conversations is not only the first step in analyzing dialogue structures, but also valuable for training dialogue systems. This paper presents a QA matching model considering both distance information and dialogue history by two simultaneous attention mechanisms called mutual attention. Given scores computed by the trained model between each non-question turn with its candidate questions, a greedy matching strategy is used for final predictions. Because existing dialogue datasets such as the Ubuntu dataset are not suitable for the QA matching task, we further create a dataset with 1,000 labeled dialogues and demonstrate that our proposed model outperforms the state-of-the-art and other strong baselines, particularly for matching long-distance QA pairs.

原文作者:Qi Jia, Mengxue Zhang, Shengyao Zhang, Kenny Q. Zhu

原文地址:https://arxiv.org/abs/2005.09276

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 基于机器学习的自行车共享系统中自行车可用性建模(CS CY)

    本文使用机器学习算法对旧金山湾区自行车共享站点的自行车可用性进行了建模。随机森林(RF)和最小二乘增强(LSBoost)被用作单变量回归算法,偏最小二乘回归(P...

    小童
  • 蒙特利尔AI伦理研究所对苏格兰AI战略的回应(CS CY)

    2020年1月和2020年2月,苏格兰政府发布了两份有关其人工智能(AI)策略的文件,供公众审查。蒙特利尔AI伦理研究所(MAIEI)审查了这些文件并于2020...

    小童
  • 约束机器学习的正则化方法分析(CS ML)

    引入了基于正则化的机器学习(ML)注入约束方式,以通过专家知识来改进预测模型。我们解决了在loss(学习者的准确性)和正则化项(约束满足度)之间找到平衡的问题。...

    小童
  • 一文看懂人机对话

    人机对话(Human-Machine Conversation)是指让机器理解和运用自然语言实现人机通信的技术,如图1所示。通过人机对话交互,用户可以查询信息,...

    用户1386409
  • Infor China的技术支持Ken挺棒的

    上周经过2次Webex的远程诊断,Infor的Ken顺利帮我解决了Direct Delivery Order的发票问题,相信这种问题不常碰到的,只因为我们升级系...

    崔文远TroyCui
  • NVIDIA双风扇GeForce RTX散热器破坏多GPU性能,是真的么?

    今日Lady发现国外一篇文章提到测试多片NVIDIA双风扇Geforce RTX时,会出现性能降低的状况 (点击阅读原文访问原始文章)。

    GPUS Lady
  • 学界 | 谷歌提出机器对话Self-Play框架M2M,提高自动化程度

    机器之心
  • 业界 | 人机对话评测系列之一:任务驱动多轮对话评测标准

    机器之心转载 公众号:Trio 如何评测语义领域相关技术是大家共同关注的。三角兽公司基于多年理论和相关技术实践的经验,针对语义领域的 4个方向技术,将会发表一系...

    机器之心
  • linux网络编程之socket(三):最简单的回射客户/服务器程序、time_wait 状态

    下面通过最简单的客户端/服务器程序的实例来学习socket API。 ? echoser.c 程序的功能是从客户端读取字符然后直接回射回去。 /********...

    s1mba
  • 大规模跨领域中文任务导向多轮对话数据集及模型CrossWOZ

    机器人:北京饭店你看可以吗? (用户有两个以上目的(订机票和酒店)要通过对话实现)

    朴素人工智能

扫码关注云+社区

领取腾讯云代金券