多样性文本生成任务的研究进展

2021 年 4 月 25 日 专知

©作者|王晓珂

机构|中国人民大学信息学院

研究方向 | 自然语言处理和对话系统


本文主要介绍了多样性文本生成的最新研究进展。文章也同步发布在AI Box知乎专栏(知乎搜索 AI Box专栏),欢迎大家在知乎专栏的文章下方评论留言,交流探讨!



近年来开放域的闲聊对话研究如雨后春笋般涌现,甚至还做起了跨界,如最近炙手可热的会话推荐系统。而作为人工智能王冠上明珠中的一颗,自然语言处理中随时打算挑战图灵测试的对话系统,当然是不可能止步于机械地一问一答的形式,因此本文基于一对多生成这个角度,探索相关领域的多样性生成,希望能给一对多对话生成注入新的构思。下面主要介绍近来的 5 篇多样性生成的研究成果。


01


Target Conditioning for One-to-Many Generation


这篇论文是 Facebook 收录在 EMNLP2020 的工作,主要是为了解决机器翻译模型中缺乏多样性的问题。本文认为当前的 beam search 方法生成的目标语句仍缺乏多样性,时常出现词语重复和语义重叠的问题。并且之前的模型都是在 1-to-1 的数据集上进行训练,缺少对鼓励多样性的目标函数的设计。



这篇工作借鉴了 discrete autoencoders 的思路,提出将一个 discrete target encoder 引入到翻译模型中,方便将每一个目标语句关联到对应的 variable 或者 domain。其中每一个 domain 对应一个 embedding,这样在测试阶段可以根据每个 domain embedding 来生成多样性的翻译。并且这种离散化的表示方式允许以无监督的方式来改变翻译的 domain 信息。


02


Diversify Question Generation with Continuous Content Selectors and Question Type Modeling


这篇论文是华为诺亚方舟收录在 EMNLP2020 的工作。主要关注的是 QA 工作的逆任务,基于回复和上下文来生成问题,同样这也在一对多生成的范畴内。本文主要思想是通过关注 context 中的不同位置以及表达的不同含义来建模多样性。


基于 CVAE,通过采用 multimodal 的先验分布来构造更多样的 content selectors,从而能够在 context 定位更多样的关注点。在预测 question type 时,提出 diversity-promoting 算法,主要通过引入 decay 变量来限制相同类型问题分布的出现概率,从而鼓励预测出更丰富的 question type。


03


Focus-Constrained Attention Mechanism for CVAE-based Response Generation


这篇工作是小米 AILab 和香港理工大学的合作论文。文中指出了目前基于 CVAE 的方法仅仅是依赖 discourse-level latent variable 来进行多样性的建模,认为这太过粗粒度。因此提出使用 fine-grained word-level information。

具体来说就是,首先通过引入更加细粒度的 focus 信号,来衡量对话上文和回复的语义集中度。然后提出一个 focus-constrained 的注意力机制,以充分利用 focus 信号并辅助回复的生成。实验结果表明,通过利用细粒度的 focus 信号,文中的模型确实可以产生更多样化以及更可控的回复。

04


Controllable Text Generation with Focused Variation


本文指出了当前可控文本生成的不足,在给定 attributes 的情况下,模型往往不足以生成足够相关的文本,以及很容易生成无意义或者重复的文本。

作者从 CVAE 及其变种的角度分析,当前 CVAE 系列在处理这种可控属性的问题上都表现得不是很好。当然这个不足也是当前对话生成中普遍存在的问题。真正实现可控文本的生成,那离可控地进行多样化的文本生成也就不远了。

这篇工作从可控性和多样性两个角度来进行文本生成的工作,设计 context 和 style 两类属性编码器和解码区解构整个语义空间,以此来实现属性的可控性和多样化。


05


COD3S: Diverse Generation with Discrete Semantic Signatures


本文主要针对在 decoding 阶段的采样方法进行改进。经典的 beam search 方法易造成句法、词汇、语义上的重叠和重复。因此本篇工作提出显式地捕捉语义差异的信号,从而实现多样化的采样策略。

该模型主要是用 sentence-BERT (SBERT) 获得的上下文相关语义表示,通过使用 Locality-Sensitive Hashing (LSH) 来获得句子的离散语义代码。然后采用两阶段的解码策略,获得最相关的代码,作为前缀,使用 prefix-conditioned beam search 方法进行解码。


结束语:一对多对话生成以及多样性文本生成的研究任重而道远。给模型一个输入,然后返回多个引入知识、涵盖类型广但又不存在语义重叠的回复,目前来看还没有真正地实现。希望本文能给读者带来一些启发。如有不同见解,欢迎指正批评、不吝赐教。


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DTGA” 就可以获取多样性文本生成任务的研究进展》专知下载链接

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!


欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
2

相关内容

专知会员服务
41+阅读 · 2021年6月6日
专知会员服务
71+阅读 · 2021年5月21日
领域自适应研究综述
专知会员服务
54+阅读 · 2021年5月5日
知识增强的文本生成研究进展
专知会员服务
98+阅读 · 2021年3月6日
专知会员服务
55+阅读 · 2020年12月20日
最新《知识驱动的文本生成》综述论文,44页pdf
专知会员服务
77+阅读 · 2020年10月13日
专知会员服务
31+阅读 · 2020年9月2日
鲁棒模式识别研究进展
专知会员服务
40+阅读 · 2020年8月9日
【ICML2020-浙江大学】对抗性互信息的文本生成
专知会员服务
43+阅读 · 2020年7月4日
Attention最新进展
极市平台
5+阅读 · 2020年5月30日
细粒度情感分析任务(ABSA)的最新进展
PaperWeekly
18+阅读 · 2020年1月3日
NLP领域预训练模型的现状及分析
AI科技评论
5+阅读 · 2019年11月1日
NLP领域中的迁移学习现状
AI科技评论
7+阅读 · 2019年9月1日
强化学习与文本生成
微信AI
41+阅读 · 2019年4月4日
生成对抗网络的最新研究进展
AI科技评论
5+阅读 · 2019年2月6日
基于非监督风格解离的中文诗歌生成
微信AI
4+阅读 · 2019年1月11日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
Arxiv
18+阅读 · 2020年10月9日
Arxiv
5+阅读 · 2020年6月16日
Interpretable Adversarial Training for Text
Arxiv
5+阅读 · 2019年5月30日
Metrics for Explainable AI: Challenges and Prospects
Arxiv
4+阅读 · 2018年12月11日
Adversarial Transfer Learning
Arxiv
12+阅读 · 2018年12月6日
Arxiv
7+阅读 · 2018年3月21日
VIP会员
相关VIP内容
专知会员服务
41+阅读 · 2021年6月6日
专知会员服务
71+阅读 · 2021年5月21日
领域自适应研究综述
专知会员服务
54+阅读 · 2021年5月5日
知识增强的文本生成研究进展
专知会员服务
98+阅读 · 2021年3月6日
专知会员服务
55+阅读 · 2020年12月20日
最新《知识驱动的文本生成》综述论文,44页pdf
专知会员服务
77+阅读 · 2020年10月13日
专知会员服务
31+阅读 · 2020年9月2日
鲁棒模式识别研究进展
专知会员服务
40+阅读 · 2020年8月9日
【ICML2020-浙江大学】对抗性互信息的文本生成
专知会员服务
43+阅读 · 2020年7月4日
相关资讯
Attention最新进展
极市平台
5+阅读 · 2020年5月30日
细粒度情感分析任务(ABSA)的最新进展
PaperWeekly
18+阅读 · 2020年1月3日
NLP领域预训练模型的现状及分析
AI科技评论
5+阅读 · 2019年11月1日
NLP领域中的迁移学习现状
AI科技评论
7+阅读 · 2019年9月1日
强化学习与文本生成
微信AI
41+阅读 · 2019年4月4日
生成对抗网络的最新研究进展
AI科技评论
5+阅读 · 2019年2月6日
基于非监督风格解离的中文诗歌生成
微信AI
4+阅读 · 2019年1月11日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
相关论文
Arxiv
18+阅读 · 2020年10月9日
Arxiv
5+阅读 · 2020年6月16日
Interpretable Adversarial Training for Text
Arxiv
5+阅读 · 2019年5月30日
Metrics for Explainable AI: Challenges and Prospects
Arxiv
4+阅读 · 2018年12月11日
Adversarial Transfer Learning
Arxiv
12+阅读 · 2018年12月6日
Arxiv
7+阅读 · 2018年3月21日
Top
微信扫码咨询专知VIP会员