基于预训练语言模型的文本生成研究综述 - 专知VIP

会员服务 ·

18

预训练语言模型 · 文本生成 ·

2021 年 10 月 15 日

基于预训练语言模型的文本生成研究综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

导读：本文将参考上述综述论文，从预训练语言模型应用于文本生成任务的三个挑战出发：

如何对输入数据进行编码并保持语义，使其与预训练语言模型进行融合；如何设计通用且合适的预训练语言模型架构，使其作为生成函数；如何优化生成函数，并保证生成文本满足特殊属性。并详细列举目前每个挑战下的研究进展。

文本生成是目前自然语言处理领域一项非常重要但具有挑战性的任务，它的目的是希望生成可读的自然语言文本，比较有代表性的应用，例如对话系统、文本摘要和机器翻译等。

目前，深度神经模型在文本生成研究中已取得重大进展，其优势在于深度神经网络可以端到端地学习输入数据到输出文本的语义映射，而不需要人工参与进行特征工程。但是，深度神经模型往往具有大量的参数，而大部分文本生成任务数据集都非常小，因此深度神经网络非常容易在这些数据集上过拟合，导致其无法在实际应用中进行泛化。

随着预训练语言模型（Pretrained Language Models, PLMs）范式的蓬勃发展，越来越多的研究将其运用到各种自然语言处理任务中以取得SOTA效果，例如BERT解决语言理解和GPT解决语言生成。通过在大规模语料集上进行预训练，预训练语言模型可以准确地理解自然语言并以自然语言的形式流畅表达，这两项都是完成文本生成任务的重要能力。

成为VIP会员查看完整内容

82

相关内容

预训练语言模型

预训练语言模型

近年来，预训练模型（例如ELMo、GPT、BERT和XLNet等）的快速发展大幅提升了诸多NLP任务的整体水平，同时也使得很多应用场景进入到实际落地阶段。预训练语言模型本身就是神经网络语言模型，它的特点包括：第一，可以使用大规模无标注纯文本语料进行训练；第二，可以用于各类下游NLP任务，不是针对某项定制的，但以后可用在下游NIP任务上，你不需要为下游任务专门设计一种神经网络，或者提供一种结构，直接在几种给定的固定框架中选择一种进行 fine-tune，就可以从而得到很好的结果。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

基于大型预训练语言模型的自然语言处理研究进展综述

基于大型预训练语言模型的自然语言处理研究进展综述

专知会员服务

96+阅读 · 2021年11月4日

开放领域知识图谱问答研究综述

开放领域知识图谱问答研究综述

专知会员服务

64+阅读 · 2021年10月30日

基于语言模型的预训练技术研究综述

专知会员服务

57+阅读 · 2021年10月12日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

面向自然语言处理任务的预训练模型综述

专知会员服务

61+阅读 · 2021年5月28日

知识增强的文本生成研究进展

知识增强的文本生成研究进展

专知会员服务

100+阅读 · 2021年3月6日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知会员服务

78+阅读 · 2020年10月13日

【北航】面向自然语言处理的预训练技术研究综述

【北航】面向自然语言处理的预训练技术研究综述

专知会员服务

114+阅读 · 2020年4月23日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知会员服务

105+阅读 · 2020年3月19日

图像修复研究进展综述

图像修复研究进展综述

专知

20+阅读 · 2021年3月9日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

基于图神经网络的知识图谱研究进展

基于图神经网络的知识图谱研究进展

AI科技评论

20+阅读 · 2020年8月31日

【长文综述】基于图神经网络的知识图谱研究进展

【长文综述】基于图神经网络的知识图谱研究进展

深度学习自然语言处理

15+阅读 · 2020年8月23日

【论文笔记】NLP 预训练模型综述

【论文笔记】NLP 预训练模型综述

深度学习自然语言处理

8+阅读 · 2020年5月14日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

Bert 之后：预训练语言模型与自然语言生成

Bert 之后：预训练语言模型与自然语言生成

AINLP

15+阅读 · 2019年7月16日

论文浅尝 | 基于知识库的神经网络问题生成方法

论文浅尝 | 基于知识库的神经网络问题生成方法

开放知识图谱

19+阅读 · 2019年6月21日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

人工智能学家

28+阅读 · 2018年12月4日

A Survey of Knowledge Enhanced Pre-trained Models

Arxiv

28+阅读 · 2021年10月1日

AMMUS : A Survey of Transformer-based Pretrained Models in Natural Language Processing

Arxiv

23+阅读 · 2021年8月12日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

SemEval-2020 Task 4: Commonsense Validation and Explanation

SemEval-2020 Task 4: Commonsense Validation and Explanation

Arxiv

7+阅读 · 2020年7月1日

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

Arxiv

19+阅读 · 2020年2月15日

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

Arxiv

4+阅读 · 2019年12月3日

DialoGPT: Large-Scale Generative Pre-training for Conversational Response Generation

DialoGPT: Large-Scale Generative Pre-training for Conversational Response Generation

Arxiv

5+阅读 · 2019年11月1日

What Does BERT Look At? An Analysis of BERT's Attention

Arxiv

4+阅读 · 2019年6月11日

Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering

Arxiv

7+阅读 · 2018年6月12日

Big Data: Understanding Big Data

Arxiv

6+阅读 · 2016年1月15日

VIP会员

相关主题

预训练语言模型

相关VIP内容

基于大型预训练语言模型的自然语言处理研究进展综述

基于大型预训练语言模型的自然语言处理研究进展综述

专知会员服务

96+阅读 · 2021年11月4日

开放领域知识图谱问答研究综述

开放领域知识图谱问答研究综述

专知会员服务

64+阅读 · 2021年10月30日

基于语言模型的预训练技术研究综述

专知会员服务

57+阅读 · 2021年10月12日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

面向自然语言处理任务的预训练模型综述

专知会员服务

61+阅读 · 2021年5月28日

知识增强的文本生成研究进展

知识增强的文本生成研究进展

专知会员服务

100+阅读 · 2021年3月6日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知会员服务

78+阅读 · 2020年10月13日

【北航】面向自然语言处理的预训练技术研究综述

【北航】面向自然语言处理的预训练技术研究综述

专知会员服务

114+阅读 · 2020年4月23日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知会员服务

105+阅读 · 2020年3月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

图像修复研究进展综述

图像修复研究进展综述

专知

20+阅读 · 2021年3月9日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

基于图神经网络的知识图谱研究进展

基于图神经网络的知识图谱研究进展

AI科技评论

20+阅读 · 2020年8月31日

【长文综述】基于图神经网络的知识图谱研究进展

【长文综述】基于图神经网络的知识图谱研究进展

深度学习自然语言处理

15+阅读 · 2020年8月23日

【论文笔记】NLP 预训练模型综述

【论文笔记】NLP 预训练模型综述

深度学习自然语言处理

8+阅读 · 2020年5月14日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

Bert 之后：预训练语言模型与自然语言生成

Bert 之后：预训练语言模型与自然语言生成

AINLP

15+阅读 · 2019年7月16日

论文浅尝 | 基于知识库的神经网络问题生成方法

论文浅尝 | 基于知识库的神经网络问题生成方法

开放知识图谱

19+阅读 · 2019年6月21日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

人工智能学家

28+阅读 · 2018年12月4日

相关论文

A Survey of Knowledge Enhanced Pre-trained Models

Arxiv

28+阅读 · 2021年10月1日

AMMUS : A Survey of Transformer-based Pretrained Models in Natural Language Processing

Arxiv

23+阅读 · 2021年8月12日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

SemEval-2020 Task 4: Commonsense Validation and Explanation

SemEval-2020 Task 4: Commonsense Validation and Explanation

Arxiv

7+阅读 · 2020年7月1日

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

Arxiv

19+阅读 · 2020年2月15日

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

Arxiv

4+阅读 · 2019年12月3日

DialoGPT: Large-Scale Generative Pre-training for Conversational Response Generation

DialoGPT: Large-Scale Generative Pre-training for Conversational Response Generation

Arxiv

5+阅读 · 2019年11月1日

What Does BERT Look At? An Analysis of BERT's Attention

Arxiv

4+阅读 · 2019年6月11日

Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering

Arxiv

7+阅读 · 2018年6月12日

Big Data: Understanding Big Data

Arxiv

6+阅读 · 2016年1月15日

微信扫码咨询专知VIP会员