不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides - 专知

会员服务 ·

0

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

2022 年 10 月 29 日 新智元

新智元报道

来源：专知

编辑：Aeneas

【新智元导读】本课程旨在帮助您在自然语言处理方面进行前沿研究，特别是与预训练语言模型相关的主题。

在过去3-4年中，大型语言模型(LLMs)彻底改变了自然语言处理(NLP)领域。它们构成了最先进的系统的基础，在解决广泛的自然语言理解和生成任务时无处不在。随着前所未有的潜力和能力，这些模型也带来了新的道德和可扩展性挑战。本课程旨在涵盖围绕预训练语言模型的前沿研究课题。我们将讨论它们的技术基础(BERT、GPT、T5模型、专家混合模型、基于检索的模型)、新出现的功能(知识、推理、少样本学习、上下文学习)、微调和适应、系统设计以及安全和伦理。我们将涵盖每个主题，并深入讨论重要论文。学生将被期望定期阅读和提交研究论文，并在结束时完成一个研究项目。

这是一门高级研究生课程，所有学生都应该上过机器学习和NLP课程，并熟悉诸如transformer等深度学习模型。

https://www.cs.princeton.edu/courses/archive/fall22/cos597G/

学习目标

本课程旨在帮助您在自然语言处理方面进行前沿研究，特别是与预训练语言模型相关的主题。我们将讨论最先进的技术，它们的能力和局限性。
练习你的研究技能，包括阅读研究论文，进行文献调查，口头报告，以及提供建设性的反馈。
通过期末项目获得实践经验，从头脑风暴到实施和实证评估，再到撰写期末论文。

课程内容：

引言
BERT
T5 (encoder-decoder models)
GPT-3 (decoder-only models)
Prompting for few-shot learning
Prompting as parameter-efficient fine-tuning
In-context learning
Calibration of prompting LLMs
Reasoning
Knowledge
Data

参考论文：On the Opportunities and Risks of Foundation Models

作者：Percy Liang、李飞飞等
论文链接：https://arxiv.org/pdf/2108.07258.pdf

摘要：最近，斯坦福大学的 Percy Liang、Rishi Bommasani（Percy Liang 的学生）、李飞飞等 100 多位研究者联名发布了一篇论文。在论文中，他们给大模型取了一个名字——「基础模型（foundation model）」，并系统探讨了基础模型的机遇与风险。「基础」代表至关重要，但并不完备。

论文正文分为四个部分，分别阐述了基础模型的能力、应用、相关技术和社会影响，其具体内容如下：

能力：语言、视觉、机器人学、推理、交互、理解等；
应用：医疗、法律、教育等；
技术：建模、训练、适应、评估、系统、数据、安全与隐私、稳健性、理论、可解释性等；
社会影响：不平等、滥用、环境、法规、经济、伦理等。

这篇论文的问世将为负责任地发展、部署基础模型提供一些借鉴。

参考资料：

https://mp.weixin.qq.com/s/tS454NVvB__-jXGD2Hew3g

登录查看更多

5

相关内容

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

专知会员服务

24+阅读 · 2022年9月30日

不可错过！UCSD《机器学习数据系统(ML)》2021课程

不可错过！UCSD《机器学习数据系统(ML)》2021课程

专知会员服务

32+阅读 · 2021年11月13日

【IJCAI2021-Tutorial】机器阅读理解: 预训练语言模型，99页ppt

专知会员服务

39+阅读 · 2021年8月22日

BERT、GPT-3等预训练模型大一统？斯坦福Percy Liang、李飞飞等114位作者发布212页综述，阐述大模型机遇与风险

BERT、GPT-3等预训练模型大一统？斯坦福Percy Liang、李飞飞等114位作者发布212页综述，阐述大模型机遇与风险

专知会员服务

69+阅读 · 2021年8月19日

普林斯顿大学陈丹琦主讲2021课程《高级自然语言处理》课程，12讲带你学习NLP最新技术

专知会员服务

89+阅读 · 2021年4月26日

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

专知会员服务

91+阅读 · 2020年4月6日

普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

专知会员服务

154+阅读 · 2020年3月29日

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

专知会员服务

112+阅读 · 2020年1月7日

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

专知会员服务

85+阅读 · 2019年12月11日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

64+阅读 · 2019年10月27日

不可错过！CMU《结构化数据机器学习》课程，附Slides

不可错过！CMU《结构化数据机器学习》课程，附Slides

专知

0+阅读 · 2022年11月2日

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

专知

1+阅读 · 2022年9月30日

【斯坦福大牛Chelsea Finn2022新课】深度多任务与元学习，附课程PPT下载

【斯坦福大牛Chelsea Finn2022新课】深度多任务与元学习，附课程PPT下载

专知

3+阅读 · 2022年9月29日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知

5+阅读 · 2022年9月14日

DeepMind发30页长文：我们要给聊天机器人不同的「三观」

DeepMind发30页长文：我们要给聊天机器人不同的「三观」

新智元

0+阅读 · 2022年9月11日

清华陈丹琦：如何让「大模型」变小

清华陈丹琦：如何让「大模型」变小

THU数据派

11+阅读 · 2022年7月28日

ACL 2022 | NLP领域最新热门研究，你一定不能错过！

ACL 2022 | NLP领域最新热门研究，你一定不能错过！

微软研究院AI头条

0+阅读 · 2022年5月19日

Percy Liang、李飞飞等百余位学者联名发布：「基础模型」的机遇与挑战

Percy Liang、李飞飞等百余位学者联名发布：「基础模型」的机遇与挑战

THU数据派

1+阅读 · 2021年9月6日

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

专知

18+阅读 · 2021年5月8日

不可错过！普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

不可错过！普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

专知

32+阅读 · 2020年3月29日

超强耦合下受限量子系统的量子相干效应及其量子调控

国家自然科学基金

0+阅读 · 2015年12月31日

半参数空间自回归模型的理论研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

黎曼流形上 Ricci 曲率的几何

国家自然科学基金

3+阅读 · 2015年12月31日

有限半群与半群簇

国家自然科学基金

1+阅读 · 2013年12月31日

基于主干成分的句法统计机器翻译模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

类风湿关节炎虚、实证候分类的生物基础研究

国家自然科学基金

0+阅读 · 2013年12月31日

低维量子系统中关联效应和量子相变

国家自然科学基金

0+阅读 · 2012年12月31日

海量不确定数据流的分布并行Skyline查询处理模型与算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

机器学习中模型选择问题的研究及其在图像理解中的应用

国家自然科学基金

8+阅读 · 2008年12月31日

超过程及相关SPDE的研究

国家自然科学基金

0+阅读 · 2008年12月31日

Variational Reasoning over Incomplete Knowledge Graphs for Conversational Recommendation

Arxiv

0+阅读 · 2022年12月22日

SERENGETI: Massively Multilingual Language Models for Africa

Arxiv

0+阅读 · 2022年12月21日

In-context Learning Distillation: Transferring Few-shot Learning Ability of Pre-trained Language Models

Arxiv

0+阅读 · 2022年12月20日

Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing

Arxiv

30+阅读 · 2021年7月28日

KG-BART: Knowledge Graph-Augmented BART for Generative Commonsense Reasoning

Arxiv

27+阅读 · 2021年1月21日

Making Pre-trained Language Models Better Few-shot Learners

Arxiv

14+阅读 · 2020年12月31日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Few-shot Natural Language Generation for Task-Oriented Dialog

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

TinyBERT: Distilling BERT for Natural Language Understanding

TinyBERT: Distilling BERT for Natural Language Understanding

Arxiv

11+阅读 · 2019年9月23日

BERT for Joint Intent Classification and Slot Filling

Arxiv

13+阅读 · 2019年2月28日

VIP会员

相关主题

相关VIP内容

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

专知会员服务

24+阅读 · 2022年9月30日

不可错过！UCSD《机器学习数据系统(ML)》2021课程

不可错过！UCSD《机器学习数据系统(ML)》2021课程

专知会员服务

32+阅读 · 2021年11月13日

【IJCAI2021-Tutorial】机器阅读理解: 预训练语言模型，99页ppt

专知会员服务

39+阅读 · 2021年8月22日

BERT、GPT-3等预训练模型大一统？斯坦福Percy Liang、李飞飞等114位作者发布212页综述，阐述大模型机遇与风险

BERT、GPT-3等预训练模型大一统？斯坦福Percy Liang、李飞飞等114位作者发布212页综述，阐述大模型机遇与风险

专知会员服务

69+阅读 · 2021年8月19日

普林斯顿大学陈丹琦主讲2021课程《高级自然语言处理》课程，12讲带你学习NLP最新技术

专知会员服务

89+阅读 · 2021年4月26日

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

专知会员服务

91+阅读 · 2020年4月6日

普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

专知会员服务

154+阅读 · 2020年3月29日

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

专知会员服务

112+阅读 · 2020年1月7日

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

专知会员服务

85+阅读 · 2019年12月11日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

64+阅读 · 2019年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

不可错过！CMU《结构化数据机器学习》课程，附Slides

不可错过！CMU《结构化数据机器学习》课程，附Slides

专知

0+阅读 · 2022年11月2日

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

专知

1+阅读 · 2022年9月30日

【斯坦福大牛Chelsea Finn2022新课】深度多任务与元学习，附课程PPT下载

【斯坦福大牛Chelsea Finn2022新课】深度多任务与元学习，附课程PPT下载

专知

3+阅读 · 2022年9月29日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知

5+阅读 · 2022年9月14日

DeepMind发30页长文：我们要给聊天机器人不同的「三观」

DeepMind发30页长文：我们要给聊天机器人不同的「三观」

新智元

0+阅读 · 2022年9月11日

清华陈丹琦：如何让「大模型」变小

清华陈丹琦：如何让「大模型」变小

THU数据派

11+阅读 · 2022年7月28日

ACL 2022 | NLP领域最新热门研究，你一定不能错过！

ACL 2022 | NLP领域最新热门研究，你一定不能错过！

微软研究院AI头条

0+阅读 · 2022年5月19日

Percy Liang、李飞飞等百余位学者联名发布：「基础模型」的机遇与挑战

Percy Liang、李飞飞等百余位学者联名发布：「基础模型」的机遇与挑战

THU数据派

1+阅读 · 2021年9月6日

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

专知

18+阅读 · 2021年5月8日

不可错过！普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

不可错过！普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

专知

32+阅读 · 2020年3月29日

相关基金

超强耦合下受限量子系统的量子相干效应及其量子调控

国家自然科学基金

0+阅读 · 2015年12月31日

半参数空间自回归模型的理论研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

黎曼流形上 Ricci 曲率的几何

国家自然科学基金

3+阅读 · 2015年12月31日

有限半群与半群簇

国家自然科学基金

1+阅读 · 2013年12月31日

基于主干成分的句法统计机器翻译模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

类风湿关节炎虚、实证候分类的生物基础研究

国家自然科学基金

0+阅读 · 2013年12月31日

低维量子系统中关联效应和量子相变

国家自然科学基金

0+阅读 · 2012年12月31日

海量不确定数据流的分布并行Skyline查询处理模型与算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

机器学习中模型选择问题的研究及其在图像理解中的应用

国家自然科学基金

8+阅读 · 2008年12月31日

超过程及相关SPDE的研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Variational Reasoning over Incomplete Knowledge Graphs for Conversational Recommendation

Arxiv

0+阅读 · 2022年12月22日

SERENGETI: Massively Multilingual Language Models for Africa

Arxiv

0+阅读 · 2022年12月21日

In-context Learning Distillation: Transferring Few-shot Learning Ability of Pre-trained Language Models

Arxiv

0+阅读 · 2022年12月20日

Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing

Arxiv

30+阅读 · 2021年7月28日

KG-BART: Knowledge Graph-Augmented BART for Generative Commonsense Reasoning

Arxiv

27+阅读 · 2021年1月21日

Making Pre-trained Language Models Better Few-shot Learners

Arxiv

14+阅读 · 2020年12月31日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Few-shot Natural Language Generation for Task-Oriented Dialog

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

TinyBERT: Distilling BERT for Natural Language Understanding

TinyBERT: Distilling BERT for Natural Language Understanding

Arxiv

11+阅读 · 2019年9月23日

BERT for Joint Intent Classification and Slot Filling

Arxiv

13+阅读 · 2019年2月28日

大家都在搜

CMU博士论文

无人机集群

软件无线电

国防科技创新

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员