【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt - 专知VIP

会员服务 ·

38

GPT-3 · 语言模型 · 少样本学习 ·

2020 年 12 月 19 日

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

GPT-3: Few-Shot Learning with a Giant Language Model

最近的工作表明，通过对大量文本语料库进行预训练，然后对特定任务进行微调，在许多NLP任务和基准测试方面取得了实质性进展。虽然这种方法在架构中通常与任务无关，但它仍然需要成千上万个样例的特定于任务的微调数据集。相比之下，人类通常只通过几个例子或简单的指令就能完成一项新的语言任务——这是目前的NLP系统在很大程度上难以做到的。我将讨论GPT-3，这是一种具有1750亿个参数的自回归语言模型，它演示了如何扩大语言模型可以极大地改善与任务无关的、少样本的性能，有时甚至可以达到与先前的最先进的微调方法相媲美的竞争力。GPT-3可以应用于没有任何渐变更新或微调的任务，与少数样本演示指定纯粹通过文本与模型的交互。我将概述GPT-3是什么以及它是如何工作的，讨论我们从这样一个系统中看到的功能，以及它们如何启用与语言模型交互的新方式，此外还将关注这些交互带来的局限性和更广泛的问题。

https://nlp.stanford.edu/seminar/details/melaniesubbiah.shtml

成为VIP会员查看完整内容

相关内容

GPT-3

【普林斯顿陈丹琦团队】使预训练语言模型成为更好的少样本学习器

专知会员服务

32+阅读 · 2021年1月4日

最新《弱监督预训练语言模型微调》报告，52页ppt

最新《弱监督预训练语言模型微调》报告，52页ppt

专知会员服务

38+阅读 · 2020年12月26日

【NeurIPS2020】因果推断学习教程，70页ppt

【NeurIPS2020】因果推断学习教程，70页ppt

专知会员服务

196+阅读 · 2020年12月12日

NeurIPS2020最新《深度对话人工智能》教程，130页ppt

NeurIPS2020最新《深度对话人工智能》教程，130页ppt

专知会员服务

42+阅读 · 2020年12月10日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【Facebook AI】无监督机器翻译，336页ppt，Unsupervised Machine Translation

专知会员服务

19+阅读 · 2020年11月17日

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

专知会员服务

16+阅读 · 2020年10月18日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

203+阅读 · 2020年5月22日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

多项NLP任务新SOTA，Facebook提出预训练模型BART

多项NLP任务新SOTA，Facebook提出预训练模型BART

机器之心

22+阅读 · 2019年11月4日

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

雷锋网

5+阅读 · 2019年6月20日

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

AI科技评论

6+阅读 · 2019年6月20日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

量子位

18+阅读 · 2019年5月4日

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

专知

18+阅读 · 2019年3月24日

Ruder博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

Ruder博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

专知

5+阅读 · 2019年2月28日

3分钟看懂史上最强NLP模型BERT

3分钟看懂史上最强NLP模型BERT

机器学习算法与Python学习

8+阅读 · 2019年2月27日

小数据、高准确率的文本分类：利用迁移学习创造通用语言模型

小数据、高准确率的文本分类：利用迁移学习创造通用语言模型

AI前线

6+阅读 · 2018年6月7日

Domain Adaptation in Dialogue Systems using Transfer and Meta-Learning

Domain Adaptation in Dialogue Systems using Transfer and Meta-Learning

Arxiv

1+阅读 · 2021年2月22日

Safe and Uncertainty-Aware Robotic Motion Planning Techniques for Agile On-Orbit Assembly

Arxiv

0+阅读 · 2021年2月20日

Long-Tail Zero and Few-Shot Learning via Contrastive Pretraining on and for Small Data

Arxiv

0+阅读 · 2021年2月19日

Modelling Hierarchical Structure between Dialogue Policy and Natural Language Generator with Option Framework for Task-oriented Dialogue System

Arxiv

0+阅读 · 2021年2月19日

SLAKE: A Semantically-Labeled Knowledge-Enhanced Dataset for Medical Visual Question Answering

SLAKE: A Semantically-Labeled Knowledge-Enhanced Dataset for Medical Visual Question Answering

Arxiv

1+阅读 · 2021年2月18日

Semantic Hypergraphs

Semantic Hypergraphs

Arxiv

0+阅读 · 2021年2月18日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Few-shot Natural Language Generation for Task-Oriented Dialog

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

A BERT Baseline for the Natural Questions

Arxiv

8+阅读 · 2019年3月21日

Adversarial Meta-Learning

Arxiv

7+阅读 · 2018年6月8日

VIP会员

相关主题

少样本学习

相关VIP内容

【普林斯顿陈丹琦团队】使预训练语言模型成为更好的少样本学习器

专知会员服务

32+阅读 · 2021年1月4日

最新《弱监督预训练语言模型微调》报告，52页ppt

最新《弱监督预训练语言模型微调》报告，52页ppt

专知会员服务

38+阅读 · 2020年12月26日

【NeurIPS2020】因果推断学习教程，70页ppt

【NeurIPS2020】因果推断学习教程，70页ppt

专知会员服务

196+阅读 · 2020年12月12日

NeurIPS2020最新《深度对话人工智能》教程，130页ppt

NeurIPS2020最新《深度对话人工智能》教程，130页ppt

专知会员服务

42+阅读 · 2020年12月10日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【Facebook AI】无监督机器翻译，336页ppt，Unsupervised Machine Translation

专知会员服务

19+阅读 · 2020年11月17日

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

专知会员服务

16+阅读 · 2020年10月18日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

203+阅读 · 2020年5月22日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

多项NLP任务新SOTA，Facebook提出预训练模型BART

多项NLP任务新SOTA，Facebook提出预训练模型BART

机器之心

22+阅读 · 2019年11月4日

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

雷锋网

5+阅读 · 2019年6月20日

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

AI科技评论

6+阅读 · 2019年6月20日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

量子位

18+阅读 · 2019年5月4日

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

专知

18+阅读 · 2019年3月24日

Ruder博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

Ruder博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

专知

5+阅读 · 2019年2月28日

3分钟看懂史上最强NLP模型BERT

3分钟看懂史上最强NLP模型BERT

机器学习算法与Python学习

8+阅读 · 2019年2月27日

小数据、高准确率的文本分类：利用迁移学习创造通用语言模型

小数据、高准确率的文本分类：利用迁移学习创造通用语言模型

AI前线

6+阅读 · 2018年6月7日

相关论文

Domain Adaptation in Dialogue Systems using Transfer and Meta-Learning

Domain Adaptation in Dialogue Systems using Transfer and Meta-Learning

Arxiv

1+阅读 · 2021年2月22日

Safe and Uncertainty-Aware Robotic Motion Planning Techniques for Agile On-Orbit Assembly

Arxiv

0+阅读 · 2021年2月20日

Long-Tail Zero and Few-Shot Learning via Contrastive Pretraining on and for Small Data

Arxiv

0+阅读 · 2021年2月19日

Modelling Hierarchical Structure between Dialogue Policy and Natural Language Generator with Option Framework for Task-oriented Dialogue System

Arxiv

0+阅读 · 2021年2月19日

SLAKE: A Semantically-Labeled Knowledge-Enhanced Dataset for Medical Visual Question Answering

SLAKE: A Semantically-Labeled Knowledge-Enhanced Dataset for Medical Visual Question Answering

Arxiv

1+阅读 · 2021年2月18日

Semantic Hypergraphs

Semantic Hypergraphs

Arxiv

0+阅读 · 2021年2月18日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Few-shot Natural Language Generation for Task-Oriented Dialog

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

A BERT Baseline for the Natural Questions

Arxiv

8+阅读 · 2019年3月21日

Adversarial Meta-Learning

Arxiv

7+阅读 · 2018年6月8日

微信扫码咨询专知VIP会员