【AAAI2020论文】多轮对话系统中的历史自适应知识融合机制, 中科院信工所孙雅静等

2019 年 11 月 24 日 专知

导读

近些年来，大家对于多轮对话中保持对话的一致性和减少重复性的问题。本文介绍中科院信工所孙雅静等人AAAI2020的工作《History-adaption Knowledge Incorporation Mechanism for Multi-turn Dialogue System》，该论文提出了一种history-adaption knowledge incorporation 机制，动态的考虑对话历史和知识之间的信息相互传递,增强检索式对话中的对话一致性以及避免重复性。

动机

大部分的对话系统模型考虑将个性化知识或者背景知识融入到对话中提高对话的质量，但是却忽略了重复融合相同的知识在对话中会产生重复性问题。因此在将外部知识融合到对话中时我们不仅应该考虑当前对话和外部知识的语义相关性，同时在整个对话的层次上尽量避免外部知识的重复性使用。在提高对话质量的同时避免对话重复。

核心思想

我们设计了基于历史自适应的知识融合机制，该机制使用每一轮对话历史和知识进行感知，得到knowledge-grounded历史表示，同时设计了特殊的门机制来控制流向下一轮对话的知识的信息，隐式的控制知识的使用。Knowledge-grounded 历史表示融合了知识的信息，同时我们使用层次的历史编码，增强对话的理解；history-aware 的知识表示参考了历史信息，避免了知识的重复性使用。

模型结构

任务定义:给定数据集D=(P,C,A)，其中外部知识表示为P={p₁，p₂, ...,p_l_p}，其中 p_i ={p_i,1，p_i,2, ...,p_i,k} .历史信息C={c₁，c₂, ...,c_lc}，其中c_i={c_i,1，c_i,2, ...,c_i,k}. 其中c_lc表示当前对话. 候选答案A={a₁，a₂, ...,a_la} l _p ,l_c,l_a,k_, 分别表示知识的条数，对话轮数，候选答案个数以及每个句子的最大长度。模型的目标是从候选答案中选择合适的回复。

模型的总体结构如下图所示：

模型整体分为encoder layer，history-adaption layer以及output layer。

Encoder layer层主要是使用Bi-GRU对历史信息，知识信息以及候选答案进行编码，然后使用attention机制得到每个句子的上下文表示。得到的历史信息，知识信息，候选答案的上下文表示分别是h^c，h^p，h^a。

在History-adaption 层，追踪外部知识在对话中的状态对于保持对话的一致性和重复性是重要的。对于外部知识的控制和更新和对话历史是紧密相关的。基于此，我们设计了一个门机制来控制外部信息在对话中的流动。我们循环的更新外部知识同时将其融入到历史中增强对话历史信息，最后我们采用层次循环机制捕捉基于外部知识感知的对话历史信息。

假定外部知识的初始状态表示为, 我们根据历史信息动态更新的路径是：