【论文笔记】2019-ACL-Dialog State Tracking: A Neural Reading Comprehension Approach

yhlin

发布于 2023-02-27 17:03:59

4160

发布于 2023-02-27 17:03:59

文章被收录于专栏：yhlin's blog

概要

问题动机

以往的 DST 方法通常都是输出一个对所有槽值的预测概率分布，使得模型无法预测 unseen 的槽值。这篇文章的作者以不同角度看待 DST 问题，将其建模为一个阅读理解任务，让模型回答“What is the state of the current dialog ?”这个问题。

主要贡献

应用阅读理解的方法，提出了一个简单的基于注意力的神经网络模型来提取对话历史中的槽值，并克服了以往方法中的 fixed-vocabulary 问题能够生成的 unseen 状态值
将 DST 的任务描述为三个顺序决策：
- 通过简单 slot carryover 模型的二元 carryover 决策
- 通过 slot type 模型的槽类型决策
- 通过阅读理解模型的槽跨度（slot span）决策
整合 Bert 模型，得到相当大的改进
在 MultiWOZ 2.0 跨域对话数据集上取得与更复杂模型相似的精度表现

方法详解

DST as Reading Comprehension

定义对话 D 的一个子对话 D_t 作为以用户话语结束的完整对话的前缀，其状态由组成插槽 s_j(t) 的值定义，即 S(t)={s_1(t),s_2(t),.s_j(t),...,s_M(t) } 定义。

可以把 D_t 当成一篇文章，对于每一个插槽 i 制定一个问题 q_i : 槽 i 的值是多少？这样子 DST 任务就变成了一个理解 D_t 并回答问题 q_i 的阅读理解任务了！

Encoding

Dialog Encoding

【论文笔记】2019-ACL-Dialog State Tracking: A Neural Reading Comprehension Approach

并将他们作为输入馈入一个 RNN 中：

{d_1,d_2,...,d_L} = RNN(p_1,p_2,...,p_L)

L: 表示拼接序列的长度 d_i：RNN 对于每一个 token 的输出，包含上下文信息 p_i：用 Bert 模型生成的预训练词嵌入 RNN：这里使用的是单层双向 LSTM，故 d_i = (\overleftarrow{d_i};\overrightarrow{d_i})

回合对话的嵌入表示：

e(t) = (\overleftarrow{d_1};\overrightarrow{d_L})

Question Encoding

将前面定义的问题 q_i 定义为“插槽 i 的值是什么？”对于每个对话，都有 M 个对应于 M 个槽的类似问题，因此，我们将每个问题 q_i 表示为一个固定维度的向量 \bf{q}_i 来学习。

模型

Overview

如上图在完整模型设置中，三个不同的模型组件被用来进行一系列的预测：首先，使用一个 slot carryover 模型来决定是否从最后一个回合中 carryover 一个槽值。如果 slot carryover 模型决定不延续，则执行一个 slot type 预测模型，从 {Yes, No, DontCare, Span} 集合预测答案类型。如果 slot type 模型预测结果为 Span，则 Slot Span 预测模型最终将预测插槽值作为对话中 tokens 的 span(start,end)