预训练依旧强大：少样本条件下的任务导向型对话生成

2020 年 3 月 3 日 PaperWeekly

论文标题：

Few-shot Natural Language Generation for Task-Oriented Dialog

论文作者：

Baolin Peng, Chenguang Zhu, Chunyuan Li, Xiujun Li, Jinchao Li, Michael Zeng, Jianfeng Gao

论文链接：

https://arxiv.org/abs/2002.12328

项目链接：

https://aka.ms/scgpt

在任务导向型对话中，由于具体领域数据的缺乏，其生成质量长期以来都不够好。

本文首次在少样本（few-shot）场景下的任务导向型对话上，使用预训练提高所生成回复的流畅度与准确度，在自动测评和人工测评上大幅超越之前的模型。

任务导向型对话

现实生活中的对话有相当一部分都是“任务导向”的，即对话都指向一个明确的目的。

比如，用户说“洛杉矶飞往北京的机票还有吗？”，这句话的潜在意图就是机票(出发地：洛杉矶，到达地：北京)，对于对话系统来说，它就要首先识别这个意图，然后再给出相应的回复，如“目前还有从洛杉矶到北京的机票，请问您需要订何时的机票？”

这个过程可以用下图来表示：

首先，系统理解用户的意图，然后得到“槽-值”(slot-value)对，比如上面的“出发地：洛杉矶”和“到达地：北京”，最后根据意图和槽-值对生成回复。

然而，目前的任务导向型对话要么依赖于固定的模板，要么只能在有限标注数据上训练，都不能得到很好的效果。

那么，能不能用当前流行的预训练方法去提高生成回复的质量呢？当然可以！因为无标注语料本身就内含丰富的语义，在它们之上预训练自然就可以提高生成的质量。

但是，和其他的预训练有所不同的是，任务导向型的对话往往特别依赖具体的领域，领域之间的差别会导致生成回复之间也会存在巨大的差异。

为了能够进一步实现基于领域的生成，我们还要赋予模型“识别领域”的能力，这就需要依赖标注的语料了。

在无标注和有标注的语料上训练后，最后，只需要在特定领域的少样本数据集上微调，就可以把模型运用到该领域的任务型对话中了。整个过程非常简单，但能够在流畅度和准确度上都大幅超越之前的模型，具有相当的可用性。

值得一提的是，本文的作者还搭建了一个简易的Demo，如下图所示：

用户输入意图（及一些可选的槽-值对），系统就可以自动生成各种可能的回复。可以看到，生成的文本非常流畅，并且也贴近我们输入的意图，可见其实际效果是相当不错的。

预训练＋预训练＋微调＝更好的回复

本文提出的方法可以归纳为三个步骤：预训练，预训练和微调。

预训练1：首先在大规模的无标注文本上预训练。这一步和GPT-2一致。
预训练2：为了让生成的文本更贴近任务导向型对话的要求，模型还进一步在标注的数据集上预训练。这里的数据来自Schema-Guided Dialogcorpus, MultiWOZ corpus, Frame corpus和Facebook Multilingual Dialog Corpus，这些都是人工标注好的人物对话型数据集，来自各个领域，共计约400K个样本。
微调：最后，只需要在特定领域的少样本数据集下微调即可。