这篇博客文章假设读者熟悉使用波束搜索的不同变体的文本生成方法,正如在博客文章中解释的那样:“如何生成文本:使用transformer的不同解码方法生成语言”。
与普通的波束搜索不同,受限波束搜索允许我们对文本生成的输出进行控制。这很有用,因为我们有时确切地知道我们想要在输出中得到什么。例如,在一个神经机器翻译任务中,我们可以通过字典查找来知道哪些单词必须包含在最终的翻译中。有时,由于特定的上下文,对语言模型几乎同样可行的生成输出可能对最终用户并不同样可取。这两种情况都可以通过允许用户告诉模型哪些单词必须包含在最终输出中来解决。