赛尔原创 | ACL 2019 检索增强的对抗式回复生成 - 专知

会员服务 ·

0

赛尔原创 | ACL 2019 检索增强的对抗式回复生成

2019 年 7 月 4 日 哈工大SCIR

论文名称：Retrieval-Enhanced Adversarial Training for Neural Responce Generation

论文作者：朱庆福，崔磊，张伟男，韦福如，刘挺

原创作者：哈工大SCIR 博士生朱庆福

论文链接：https://arxiv.org/abs/1809.04276

1. 简介

对话系统旨在根据用户的输入消息，返回语法流畅、语义相关的回复。现有的对话系统大体可以分为以下两类：检索式对话系统和生成式对话系统。其中，检索式系统根据输入消息，在一个预先构建的回复集合中选择和该消息最匹配的回复返回给用户，回复集合中的回复大多由人工撰写。因此，检索式方法的回复流畅性好，多样性强。但由于所有的回复均事先存在，该方法不能给出回复集合外的新回复。与之相对的生成式方法，可以根据用户输入消息进行定制。但是，现有的基于Sequence to Sequence的方法倾向于生成一般性的万能回复，多样性较差。为结合这两类方法的优点，前人提出了一些检索增强的回复生成模型，使用检索式方法得到的候选回复来提升生成式方法的生成质量。但这些方法仍存在着以下两个问题：一方面，极大似然损失与真实回复质量一致性较差，同时不能准确评价候选回复在生成过程中是否被正确使用。另一方面，候选回复包含着多样的表述形式和丰富的内容，它们不仅仅提供了生成的额外材料，还为判别回复质量提供了参考，但现有方法却没有将其充分利用。

为解决上述问题，我们提出了检索增强的对抗式回复生成模型。如图1所示，该模型主要包含以下几个模块：

图1 检索增强的对抗式回复生成结构示意图

检索模块：给定用户的输入消息，该模块在训练集中经由检索、重排序，得到N-best候选回复。
生成器：生成器是一个Sequence to Sequence模型，它接收输入消息和上一步产生的N-best候选回复作为输入，然后生成相应的回复。
判别器：判别器本质上是一个二元分类器，用于判断一个回复是人生成的还是机器生成的。具体地，我们在判别过程中引入N-best候选回复作为参考，计算得到一个candidate-aware的回复表示。然后我们将该表示结合消息表示作为输入，经由多层感知机预测出回复是人生成的概率。

在训练过程中，生成器和判别器首先分别进行预训练，然后进行对抗训练。

2. 实验

我们的方法使用检索得到的候选回复提升对抗式回复生成模型的效果。首先我们验证了候选回复对于判别器准确率的提升，如图2所示：

图2 检索增强的判别器判别准确率

其中，D w/o和D w/分别表示判别器中不使用和使用候选回复。从图中我们可以看出，在判别器中引入候选回复有助于提升判别器的准确率。在对抗训练下，判别器的提升又会进一步促进生成器的提升，图3展示了自动评价指标的变化情况：

图3 检索增强的判别器下生成器的自动评价结果

其中，G w/o和G w/分别表示生成器中不使用和使用候选回复两种设置。可以看出，两种设置下判别器中引入候选回复均会带来相应的提升。类似地，我们还分析了候选回复对于生成器的增强效果，如图4所示：

图4 检索增强的生成器自动评价结果

此外，我们还从合适程度、多样程度、流畅程度三个方面进行了人工评价，共有三位标注者独立地对每一个回复从0到2进行评分，结果如表1所示，我们的方法取得了最佳的合适程度评分以及优于其他生成式方法的多样程度评分。

表1 人工评价结果表

3 总结

我们提出了一种检索增强的对抗式回复生成模型，利用检索式方法得到候选回复增强判别器和生成器，并借助对抗式训练使用提升了的判别器更进一步地促进了生成器的提升。候选回复可以近似地看做为一种非结构化的外部知识，后续我们可能会探索在对抗式框架下如何同时引入知识图谱作为结构化的外部知识得到更高质量的回复。

本期责任编辑：张伟男

本期编辑：李照鹏

“哈工大SCIR”公众号

主编：车万翔

副主编：张伟男，丁效

责任编辑：张伟男，丁效，崔一鸣，李忠阳

编辑：李家琦，赖勇魁，王若珂，李照鹏，冯梓娴，顾宇轩

登录查看更多

12

相关内容

回复生成

【ICML2020-西电】用于语言生成的递归层次主题引导RNN

【ICML2020-西电】用于语言生成的递归层次主题引导RNN

专知会员服务

22+阅读 · 2020年6月30日

近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文

近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文

专知会员服务

105+阅读 · 2020年6月9日

【SIGIR2020-中科院计算所】L2R2: 利用排名进行外展推理，L2R2: Leveraging Ranking for Abductive Reasoning

【SIGIR2020-中科院计算所】L2R2: 利用排名进行外展推理，L2R2: Leveraging Ranking for Abductive Reasoning

专知会员服务

11+阅读 · 2020年5月25日

【IJCAI2020】图神经网络预测结构化实体交互

【IJCAI2020】图神经网络预测结构化实体交互

专知会员服务

43+阅读 · 2020年5月13日

【ACL2020】用于生成深度问题的语义图，Semantic Graphs for Generating Deep Questions

【ACL2020】用于生成深度问题的语义图，Semantic Graphs for Generating Deep Questions

专知会员服务

26+阅读 · 2020年5月5日

自然语言处理顶会ACL2020放榜了，你的论文中了吗？因新冠将在线举办

自然语言处理顶会ACL2020放榜了，你的论文中了吗？因新冠将在线举办

专知会员服务

36+阅读 · 2020年4月5日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

专知会员服务

42+阅读 · 2019年11月21日

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

专知会员服务

52+阅读 · 2019年10月27日

论文浅尝 | 利用问题生成提升知识图谱问答

论文浅尝 | 利用问题生成提升知识图谱问答

开放知识图谱

20+阅读 · 2019年11月5日

ACL 2019 开源论文 | 基于知识库和大规模网络文本的问答系统

ACL 2019 开源论文 | 基于知识库和大规模网络文本的问答系统

PaperWeekly

26+阅读 · 2019年7月20日

赛尔原创 | ACL 2019 机器阅读理解中不可答问题的数据增广

赛尔原创 | ACL 2019 机器阅读理解中不可答问题的数据增广

哈工大SCIR

15+阅读 · 2019年6月21日

哈工大SCIR三篇论文被ACL 2019录用

哈工大SCIR三篇论文被ACL 2019录用

哈工大SCIR

17+阅读 · 2019年5月15日

论文浅尝 | 基于图注意力的常识对话生成

论文浅尝 | 基于图注意力的常识对话生成

开放知识图谱

8+阅读 · 2019年2月5日

论文浅尝 | 基于常识知识图谱感知和图注意力机制的对话生成

论文浅尝 | 基于常识知识图谱感知和图注意力机制的对话生成

开放知识图谱

15+阅读 · 2018年9月24日

赛尔原创 | 基于循环神经网络问句关键词提取技术研究

赛尔原创 | 基于循环神经网络问句关键词提取技术研究

哈工大SCIR

9+阅读 · 2017年11月27日

一种基于Sequence-to-Sequence的高质量对话生成方法

一种基于Sequence-to-Sequence的高质量对话生成方法

科技创新与创业

9+阅读 · 2017年11月13日

赛尔原创 | 基于深度学习的候选答案句抽取研究

赛尔原创 | 基于深度学习的候选答案句抽取研究

哈工大SCIR

5+阅读 · 2017年10月9日

赛尔原创 | 教聊天机器人进行多轮对话

赛尔原创 | 教聊天机器人进行多轮对话

哈工大SCIR

18+阅读 · 2017年9月18日

Differentiable Reasoning on Large Knowledge Bases and Natural Language

Arxiv

12+阅读 · 2019年12月17日

Story Realization: Expanding Plot Events into Sentences

Arxiv

3+阅读 · 2019年9月8日

Attention Is (not) All You Need for Commonsense Reasoning

Arxiv

7+阅读 · 2019年5月31日

Seq2Seq2Sentiment: Multimodal Sequence to Sequence Models for Sentiment Analysis

Seq2Seq2Sentiment: Multimodal Sequence to Sequence Models for Sentiment Analysis

Arxiv

5+阅读 · 2018年8月6日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

What we really want to find by Sentiment Analysis: The Relationship between Computational Models and Psychological State

Arxiv

6+阅读 · 2018年6月3日

KG^2: Learning to Reason Science Exam Questions with Contextual Knowledge Graph Embeddings

Arxiv

9+阅读 · 2018年5月31日

Working Memory Networks: Augmenting Memory Networks with a Relational Reasoning Module

Arxiv

5+阅读 · 2018年5月23日

Learning to Rank Question-Answer Pairs using Hierarchical Recurrent Encoder with Latent Topic Clustering

Arxiv

5+阅读 · 2018年4月9日

An Attentive Sequence Model for Adverse Drug Event Extraction from Biomedical Text

Arxiv

3+阅读 · 2018年1月2日

VIP会员

相关主题

生成式方法

相关VIP内容

【ICML2020-西电】用于语言生成的递归层次主题引导RNN

【ICML2020-西电】用于语言生成的递归层次主题引导RNN

专知会员服务

22+阅读 · 2020年6月30日

近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文

近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文

专知会员服务

105+阅读 · 2020年6月9日

【SIGIR2020-中科院计算所】L2R2: 利用排名进行外展推理，L2R2: Leveraging Ranking for Abductive Reasoning

【SIGIR2020-中科院计算所】L2R2: 利用排名进行外展推理，L2R2: Leveraging Ranking for Abductive Reasoning

专知会员服务

11+阅读 · 2020年5月25日

【IJCAI2020】图神经网络预测结构化实体交互

【IJCAI2020】图神经网络预测结构化实体交互

专知会员服务

43+阅读 · 2020年5月13日

【ACL2020】用于生成深度问题的语义图，Semantic Graphs for Generating Deep Questions

【ACL2020】用于生成深度问题的语义图，Semantic Graphs for Generating Deep Questions

专知会员服务

26+阅读 · 2020年5月5日

自然语言处理顶会ACL2020放榜了，你的论文中了吗？因新冠将在线举办

自然语言处理顶会ACL2020放榜了，你的论文中了吗？因新冠将在线举办

专知会员服务

36+阅读 · 2020年4月5日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

专知会员服务

42+阅读 · 2019年11月21日

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

专知会员服务

52+阅读 · 2019年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

相关资讯

论文浅尝 | 利用问题生成提升知识图谱问答

论文浅尝 | 利用问题生成提升知识图谱问答

开放知识图谱

20+阅读 · 2019年11月5日

ACL 2019 开源论文 | 基于知识库和大规模网络文本的问答系统

ACL 2019 开源论文 | 基于知识库和大规模网络文本的问答系统

PaperWeekly

26+阅读 · 2019年7月20日

赛尔原创 | ACL 2019 机器阅读理解中不可答问题的数据增广

赛尔原创 | ACL 2019 机器阅读理解中不可答问题的数据增广

哈工大SCIR

15+阅读 · 2019年6月21日

哈工大SCIR三篇论文被ACL 2019录用

哈工大SCIR三篇论文被ACL 2019录用

哈工大SCIR

17+阅读 · 2019年5月15日

论文浅尝 | 基于图注意力的常识对话生成

论文浅尝 | 基于图注意力的常识对话生成

开放知识图谱

8+阅读 · 2019年2月5日

论文浅尝 | 基于常识知识图谱感知和图注意力机制的对话生成

论文浅尝 | 基于常识知识图谱感知和图注意力机制的对话生成

开放知识图谱

15+阅读 · 2018年9月24日

赛尔原创 | 基于循环神经网络问句关键词提取技术研究

赛尔原创 | 基于循环神经网络问句关键词提取技术研究

哈工大SCIR

9+阅读 · 2017年11月27日

一种基于Sequence-to-Sequence的高质量对话生成方法

一种基于Sequence-to-Sequence的高质量对话生成方法

科技创新与创业

9+阅读 · 2017年11月13日

赛尔原创 | 基于深度学习的候选答案句抽取研究

赛尔原创 | 基于深度学习的候选答案句抽取研究

哈工大SCIR

5+阅读 · 2017年10月9日

赛尔原创 | 教聊天机器人进行多轮对话

赛尔原创 | 教聊天机器人进行多轮对话

哈工大SCIR

18+阅读 · 2017年9月18日

相关论文

Differentiable Reasoning on Large Knowledge Bases and Natural Language

Arxiv

12+阅读 · 2019年12月17日

Story Realization: Expanding Plot Events into Sentences

Arxiv

3+阅读 · 2019年9月8日

Attention Is (not) All You Need for Commonsense Reasoning

Arxiv

7+阅读 · 2019年5月31日

Seq2Seq2Sentiment: Multimodal Sequence to Sequence Models for Sentiment Analysis

Seq2Seq2Sentiment: Multimodal Sequence to Sequence Models for Sentiment Analysis

Arxiv

5+阅读 · 2018年8月6日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

What we really want to find by Sentiment Analysis: The Relationship between Computational Models and Psychological State

Arxiv

6+阅读 · 2018年6月3日

KG^2: Learning to Reason Science Exam Questions with Contextual Knowledge Graph Embeddings

Arxiv

9+阅读 · 2018年5月31日

Working Memory Networks: Augmenting Memory Networks with a Relational Reasoning Module

Arxiv

5+阅读 · 2018年5月23日

Learning to Rank Question-Answer Pairs using Hierarchical Recurrent Encoder with Latent Topic Clustering

Arxiv

5+阅读 · 2018年4月9日

An Attentive Sequence Model for Adverse Drug Event Extraction from Biomedical Text

Arxiv

3+阅读 · 2018年1月2日

大家都在搜

朱克爱德华兹家族

大型语言模型

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

微信扫码咨询专知VIP会员