基于预训练语言模型的文本生成 - 专知VIP

会员服务 ·

10

预训练 · 预训练语言模型 · 文本生成 · 综述论文 ·

2022 年 1 月 28 日

基于预训练语言模型的文本生成

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本篇综述“A Survey of Pretrained Language Models Based Text Generation”的第一作者李军毅来自中国人民大学和加拿大蒙特利尔大学，指导教师为赵鑫教授（通讯作者）和聂建云教授。作者从数据、模型和优化方法三个角度切入，主要介绍了近年来预训练语言模型技术在文本生成领域的研究进展，以及相应的挑战和解决方案；然后陆续介绍了预训练语言模型在三个代表性的文本生成任务中的应用，包括机器翻译、文本摘要和对话系统，以及广泛采用的评测基准和评价指标；最后讨论提出了若干个未来的研究方向。本文梳理了2018年至今总计200余篇预训练语言模型研究工作，为后续研究者了解熟悉此领域提供巨大帮助。

预训练语言模型技术解决文本生成任务主要考虑三个方面的挑战：1）如何有效地编码输入表示并保留其语义？本文第三章对输入数据的形态进行了划分，包括非结构化文本、结构化数据和多媒体数据，梳理了预训练语言模型针对不同类型输入的表示学习方法；2）如何设计有效的预训练语言模型作为生成函数？本文第四章介绍了四种预训练语言模型模式，包括Masked LM，Causal LM, Prefix LM和Encoder-Decoder LM，并在此基础上作出的拓展，例如增加额外的输入Embedding和Attention机制的创新；3）如何有效地优化预训练语言模型并保证输出文本满足某些语言属性？本文第五章介绍了三种针对文本生成任务的优化策略，包括传统的Fine-Tuning技术，新兴的Prompt-Tuning技术，以及针对特殊属性设计的Property-Tuning技术。

"妙笔"生花：一个易用、高效的文本生成开源库

关于预训练语言模型在文本生成任务上的应用，不得不提我们AI Box团队开发的文本生成工具包——TextBox，中文名“妙笔”。到目前为止，妙笔总共支持四个大类总计21个文本生成模型，其中就包括相关的预训练语言模型，比如GPT-2, BART, T5和ProphetNet等；同时我们也支持机器翻译、文本摘要、对话系统、data-to-text等主流生成任务和相应的测试。研究者可以方便地使用TextBox进行一站式训练，数据处理、数据加载、模型训练和测试等环节均可以由TextBox自动完成。

参考文献： [1] Li, J., Tang, T., Zhao, W.X., Nie, J. Y., & Wen, J. R. (2022). A Survey of Pretrained Language Models Based Text Generation. arXiv preprint arXiv:2201.05273.

[2] Li, J., Tang, T., He, G., Jiang, J., Hu, X.,Xie, P., ... & Wen, J. R. (2021). Textbox: A unified, modularized, and extensible framework for text generation. arXiv preprint arXiv:2101.02046.

成为VIP会员查看完整内容

29

相关内容

预训练

在搭建网络模型时，需要随机初始化参数，然后开始训练网络，不断调整直到网络的损失越来越小。在训练的过程中，一开始初始化的参数会不断变化。当参数训练到比较好的时候就可以将训练模型的参数保存下来，以便训练好的模型可以在下次执行类似任务时获得较好的结果。

基于大型预训练语言模型的自然语言处理研究进展综述

基于大型预训练语言模型的自然语言处理研究进展综述

专知会员服务

96+阅读 · 2021年11月4日

基于预训练语言模型的文本生成研究综述

专知会员服务

82+阅读 · 2021年10月15日

【IJCAI2021-Tutorial】机器阅读理解: 预训练语言模型，99页ppt

专知会员服务

39+阅读 · 2021年8月22日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

图神经网络元学习

专知会员服务

97+阅读 · 2021年5月25日

多样性文本生成任务的研究进展

专知会员服务

43+阅读 · 2021年4月23日

知识增强的文本生成研究进展

知识增强的文本生成研究进展

专知会员服务

100+阅读 · 2021年3月6日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知会员服务

78+阅读 · 2020年10月13日

【EMNLP2020】自然语言分类任务的自监督元学习

专知会员服务

30+阅读 · 2020年9月18日

搭配对比学习，万能的 prompt 还能做可控文本生成

搭配对比学习，万能的 prompt 还能做可控文本生成

夕小瑶的卖萌屋

2+阅读 · 2022年3月17日

基于自回归填空的通用语言模型预训练 | 论文荐读

基于自回归填空的通用语言模型预训练 | 论文荐读

学术头条

5+阅读 · 2022年3月14日

从 200 多篇顶会论文看预训练语言模型研究进展

从 200 多篇顶会论文看预训练语言模型研究进展

专知

0+阅读 · 2021年12月4日

ICBU可控文本生成技术详解

ICBU可控文本生成技术详解

阿里技术

1+阅读 · 2021年9月26日

详解预训练模型、信息抽取、文本生成、知识图谱、对话系统技术

详解预训练模型、信息抽取、文本生成、知识图谱、对话系统技术

夕小瑶的卖萌屋

0+阅读 · 2021年8月4日

基于编辑方法的文本生成（上）

基于编辑方法的文本生成（上）

哈工大SCIR

0+阅读 · 2021年6月30日

多样性文本生成任务的研究进展

多样性文本生成任务的研究进展

专知

2+阅读 · 2021年4月25日

Bert 之后：预训练语言模型与自然语言生成

Bert 之后：预训练语言模型与自然语言生成

AINLP

15+阅读 · 2019年7月16日

最新论文解读 | 基于预训练自然语言生成的文本摘要方法

最新论文解读 | 基于预训练自然语言生成的文本摘要方法

微软研究院AI头条

57+阅读 · 2019年3月19日

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

PaperWeekly

14+阅读 · 2019年3月18日

基于单语语料的无监督统计机器翻译模型研究

国家自然科学基金

1+阅读 · 2013年12月31日

模型驱动的大规模时空数据可视化开发方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于小框架的pMRI图像重建研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于句子语义结构的统计机器翻译研究

国家自然科学基金

1+阅读 · 2013年12月31日

目标函数多次波逆时叠前偏移

国家自然科学基金

0+阅读 · 2012年12月31日

基于数据驱动的中文自然语言生成关键技术研究

国家自然科学基金

7+阅读 · 2012年12月31日

情感信息抽取的资源建设及关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

维、哈、柯多文种信息检索技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于认知语境的文本情感计算及其应用

国家自然科学基金

1+阅读 · 2009年12月31日

面向开放领域的自动关系抽取技术研究

国家自然科学基金

5+阅读 · 2008年12月31日

Generative Biomedical Entity Linking via Knowledge Base-Guided Pre-training and Synonyms-Aware Fine-tuning

Arxiv

0+阅读 · 2022年4月20日

Multimodal Few-Shot Object Detection with Meta-Learning Based Cross-Modal Prompting

Arxiv

0+阅读 · 2022年4月16日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing

Arxiv

30+阅读 · 2021年7月28日

Making Pre-trained Language Models Better Few-shot Learners

Arxiv

14+阅读 · 2020年12月31日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

VIP会员

相关主题

预训练语言模型

相关VIP内容

基于大型预训练语言模型的自然语言处理研究进展综述

基于大型预训练语言模型的自然语言处理研究进展综述

专知会员服务

96+阅读 · 2021年11月4日

基于预训练语言模型的文本生成研究综述

专知会员服务

82+阅读 · 2021年10月15日

【IJCAI2021-Tutorial】机器阅读理解: 预训练语言模型，99页ppt

专知会员服务

39+阅读 · 2021年8月22日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

图神经网络元学习

专知会员服务

97+阅读 · 2021年5月25日

多样性文本生成任务的研究进展

专知会员服务

43+阅读 · 2021年4月23日

知识增强的文本生成研究进展

知识增强的文本生成研究进展

专知会员服务

100+阅读 · 2021年3月6日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知会员服务

78+阅读 · 2020年10月13日

【EMNLP2020】自然语言分类任务的自监督元学习

专知会员服务

30+阅读 · 2020年9月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《自适应训练辅助系统概念导论及其在空战指挥官加速培训中的应用》125页

《美陆军近战整合企业现代化计划（2025—2026）》最新报告

以色列-伊朗空战：短暂而激烈冲突的启示

《动态作战支援演习框架构建》80页

相关资讯

搭配对比学习，万能的 prompt 还能做可控文本生成

搭配对比学习，万能的 prompt 还能做可控文本生成

夕小瑶的卖萌屋

2+阅读 · 2022年3月17日

基于自回归填空的通用语言模型预训练 | 论文荐读

基于自回归填空的通用语言模型预训练 | 论文荐读

学术头条

5+阅读 · 2022年3月14日

从 200 多篇顶会论文看预训练语言模型研究进展

从 200 多篇顶会论文看预训练语言模型研究进展

专知

0+阅读 · 2021年12月4日

ICBU可控文本生成技术详解

ICBU可控文本生成技术详解

阿里技术

1+阅读 · 2021年9月26日

详解预训练模型、信息抽取、文本生成、知识图谱、对话系统技术

详解预训练模型、信息抽取、文本生成、知识图谱、对话系统技术

夕小瑶的卖萌屋

0+阅读 · 2021年8月4日

基于编辑方法的文本生成（上）

基于编辑方法的文本生成（上）

哈工大SCIR

0+阅读 · 2021年6月30日

多样性文本生成任务的研究进展

多样性文本生成任务的研究进展

专知

2+阅读 · 2021年4月25日

Bert 之后：预训练语言模型与自然语言生成

Bert 之后：预训练语言模型与自然语言生成

AINLP

15+阅读 · 2019年7月16日

最新论文解读 | 基于预训练自然语言生成的文本摘要方法

最新论文解读 | 基于预训练自然语言生成的文本摘要方法

微软研究院AI头条

57+阅读 · 2019年3月19日

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

PaperWeekly

14+阅读 · 2019年3月18日

相关基金

基于单语语料的无监督统计机器翻译模型研究

国家自然科学基金

1+阅读 · 2013年12月31日

模型驱动的大规模时空数据可视化开发方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于小框架的pMRI图像重建研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于句子语义结构的统计机器翻译研究

国家自然科学基金

1+阅读 · 2013年12月31日

目标函数多次波逆时叠前偏移

国家自然科学基金

0+阅读 · 2012年12月31日

基于数据驱动的中文自然语言生成关键技术研究

国家自然科学基金

7+阅读 · 2012年12月31日

情感信息抽取的资源建设及关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

维、哈、柯多文种信息检索技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于认知语境的文本情感计算及其应用

国家自然科学基金

1+阅读 · 2009年12月31日

面向开放领域的自动关系抽取技术研究

国家自然科学基金

5+阅读 · 2008年12月31日

相关论文

Generative Biomedical Entity Linking via Knowledge Base-Guided Pre-training and Synonyms-Aware Fine-tuning

Arxiv

0+阅读 · 2022年4月20日

Multimodal Few-Shot Object Detection with Meta-Learning Based Cross-Modal Prompting

Arxiv

0+阅读 · 2022年4月16日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing

Arxiv

30+阅读 · 2021年7月28日

Making Pre-trained Language Models Better Few-shot Learners

Arxiv

14+阅读 · 2020年12月31日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

微信扫码咨询专知VIP会员