预训练模型最新综述：过去、现在和未来，43页pdf - 专知VIP

会员服务 ·

21

预训练模型 ·

2021 年 6 月 20 日

预训练模型最新综述：过去、现在和未来，43页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

BERT、GPT 等大规模预训练模型（PTM）最近取得了巨大成功，成为人工智能领域的里程碑。由于复杂的预训练目标和庞大的模型参数，大规模 PTM 可以有效地从大量标记和未标记的数据中捕获知识。通过将知识存储到大量的参数中并对特定任务进行微调，大量参数中隐式编码的丰富知识可以使各种下游任务受益，这已通过实验验证和实证分析得到广泛证明。现在人工智能社区的共识是采用 PTM 作为下游任务的支柱，而不是从头开始学习模型。

在本文中，我们深入研究了预训练的历史，尤其是它与迁移学习和自监督学习的特殊关系，以揭示 PTM 在 AI 开发领域中的关键地位。此外，我们全面回顾了 PTM 的最新突破。这些突破是由计算能力的激增和数据可用性的增加推动的，朝着四个重要方向发展：设计有效的架构、利用丰富的上下文、提高计算效率以及进行解释和理论分析。最后，我们讨论了 PTMs 的一系列开放问题和研究方向，希望我们的观点能够启发和推动 PTMs 的未来研究。

https://www.zhuanzhi.ai/paper/ae20bc29350325ac02c0804c693c0cfb

成为VIP会员查看完整内容

84

相关内容

最新「基于Transformer的预训练模型」综述论文，42页pdf304篇文献

最新「基于Transformer的预训练模型」综述论文，42页pdf304篇文献

专知会员服务

109+阅读 · 2021年8月13日

面向自然语言处理任务的预训练模型综述

专知会员服务

61+阅读 · 2021年5月28日

跨媒体分析与推理技术研究综述

跨媒体分析与推理技术研究综述

专知会员服务

70+阅读 · 2021年3月11日

自然语言处理现代方法，176页pdf

自然语言处理现代方法，176页pdf

专知会员服务

269+阅读 · 2021年2月22日

卷积神经网络模型发展及应用(中文版)，20页pdf

卷积神经网络模型发展及应用(中文版)，20页pdf

专知会员服务

89+阅读 · 2021年1月15日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

专知会员服务

37+阅读 · 2020年11月11日

【邱锡鹏老师CIPSATT2020教程】自然语言处理中的预训练模型，149页ppt

专知会员服务

105+阅读 · 2020年11月10日

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

专知会员服务

123+阅读 · 2020年9月11日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知会员服务

37+阅读 · 2020年6月16日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

最新《多任务学习》综述，39页pdf

最新《多任务学习》综述，39页pdf

专知

28+阅读 · 2020年7月10日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

37+阅读 · 2020年6月17日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知

9+阅读 · 2020年6月16日

【论文笔记】NLP 预训练模型综述

【论文笔记】NLP 预训练模型综述

深度学习自然语言处理

8+阅读 · 2020年5月14日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

综述：可解释的知识系统发展方向，附17页论文下载

综述：可解释的知识系统发展方向，附17页论文下载

专知

5+阅读 · 2020年3月19日

微软研究院出品《数据科学基础》，放眼未来40年（附PDF下载）

微软研究院出品《数据科学基础》，放眼未来40年（附PDF下载）

THU数据派

40+阅读 · 2019年5月21日

【机器学习】机器学习：未来十年研究热点

【机器学习】机器学习：未来十年研究热点

产业智能官

16+阅读 · 2018年11月4日

从0到1，这篇深度学习综述送给你！

从0到1，这篇深度学习综述送给你！

机器学习算法与Python学习

27+阅读 · 2018年6月13日

MeDiaQA: A Question Answering Dataset on Medical Dialogues

Arxiv

0+阅读 · 2021年8月18日

AMMUS : A Survey of Transformer-based Pretrained Models in Natural Language Processing

Arxiv

23+阅读 · 2021年8月12日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

MATCH: Metadata-Aware Text Classification in A Large Hierarchy

Arxiv

12+阅读 · 2021年2月15日

Text Classification Algorithms: A Survey

Arxiv

16+阅读 · 2020年5月20日

Recent Advances and Challenges in Task-oriented Dialog System

Recent Advances and Challenges in Task-oriented Dialog System

Arxiv

19+阅读 · 2020年3月19日

TinyBERT: Distilling BERT for Natural Language Understanding

TinyBERT: Distilling BERT for Natural Language Understanding

Arxiv

11+阅读 · 2019年9月23日

SFA: Small Faces Attention Face Detector

Arxiv

4+阅读 · 2018年12月20日

Stacked Cross Attention for Image-Text Matching

Arxiv

3+阅读 · 2018年3月21日

Knowledge-based Word Sense Disambiguation using Topic Models

Arxiv

5+阅读 · 2018年1月5日

VIP会员

相关主题

预训练模型

相关VIP内容

最新「基于Transformer的预训练模型」综述论文，42页pdf304篇文献

最新「基于Transformer的预训练模型」综述论文，42页pdf304篇文献

专知会员服务

109+阅读 · 2021年8月13日

面向自然语言处理任务的预训练模型综述

专知会员服务

61+阅读 · 2021年5月28日

跨媒体分析与推理技术研究综述

跨媒体分析与推理技术研究综述

专知会员服务

70+阅读 · 2021年3月11日

自然语言处理现代方法，176页pdf

自然语言处理现代方法，176页pdf

专知会员服务

269+阅读 · 2021年2月22日

卷积神经网络模型发展及应用(中文版)，20页pdf

卷积神经网络模型发展及应用(中文版)，20页pdf

专知会员服务

89+阅读 · 2021年1月15日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

专知会员服务

37+阅读 · 2020年11月11日

【邱锡鹏老师CIPSATT2020教程】自然语言处理中的预训练模型，149页ppt

专知会员服务

105+阅读 · 2020年11月10日

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

专知会员服务

123+阅读 · 2020年9月11日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知会员服务

37+阅读 · 2020年6月16日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

《生态建模密码破译：建模与编程实践》美陆军最新报告

大模型解决方案白皮书：社交陪伴场景全流程落地指南

面向具身操作的视觉-语言-动作模型综述

相关资讯

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

最新《多任务学习》综述，39页pdf

最新《多任务学习》综述，39页pdf

专知

28+阅读 · 2020年7月10日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

37+阅读 · 2020年6月17日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知

9+阅读 · 2020年6月16日

【论文笔记】NLP 预训练模型综述

【论文笔记】NLP 预训练模型综述

深度学习自然语言处理

8+阅读 · 2020年5月14日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

综述：可解释的知识系统发展方向，附17页论文下载

综述：可解释的知识系统发展方向，附17页论文下载

专知

5+阅读 · 2020年3月19日

微软研究院出品《数据科学基础》，放眼未来40年（附PDF下载）

微软研究院出品《数据科学基础》，放眼未来40年（附PDF下载）

THU数据派

40+阅读 · 2019年5月21日

【机器学习】机器学习：未来十年研究热点

【机器学习】机器学习：未来十年研究热点

产业智能官

16+阅读 · 2018年11月4日

从0到1，这篇深度学习综述送给你！

从0到1，这篇深度学习综述送给你！

机器学习算法与Python学习

27+阅读 · 2018年6月13日

相关论文

MeDiaQA: A Question Answering Dataset on Medical Dialogues

Arxiv

0+阅读 · 2021年8月18日

AMMUS : A Survey of Transformer-based Pretrained Models in Natural Language Processing

Arxiv

23+阅读 · 2021年8月12日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

MATCH: Metadata-Aware Text Classification in A Large Hierarchy

Arxiv

12+阅读 · 2021年2月15日

Text Classification Algorithms: A Survey

Arxiv

16+阅读 · 2020年5月20日

Recent Advances and Challenges in Task-oriented Dialog System

Recent Advances and Challenges in Task-oriented Dialog System

Arxiv

19+阅读 · 2020年3月19日

TinyBERT: Distilling BERT for Natural Language Understanding

TinyBERT: Distilling BERT for Natural Language Understanding

Arxiv

11+阅读 · 2019年9月23日

SFA: Small Faces Attention Face Detector

Arxiv

4+阅读 · 2018年12月20日

Stacked Cross Attention for Image-Text Matching

Arxiv

3+阅读 · 2018年3月21日

Knowledge-based Word Sense Disambiguation using Topic Models

Arxiv

5+阅读 · 2018年1月5日

微信扫码咨询专知VIP会员