ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频 - 专知

会员服务 ·

0

ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频

2022 年 7 月 18 日 专知

【导读】预训练大模型是现在关注的研究热点之一。ICML 2022 大会于 7 月 17 日 - 23 日在美国马里兰州巴尔的摩市以线上线下结合的方式举办。来自伯克利的几位学者的《大模型训练与服务》技术教程，模型并行训练和服务中的研究和实践痛点，值得关注！

近年来，ML和系统的研究人员一直在合作，将大型模型(如带有175B参数的GPT-3)引入研究和生产。据揭示，增加模型大小可以显著提高ML的性能，甚至可以带来根本的新功能。

然而，试验和采用大模型需要新的技术和系统来支持他们对大数据和大集群的训练和推理。本教程确定了模型并行训练和服务中的研究和实践痛点。特别地，本教程介绍了新的算法技术和系统架构，用于处理流行的大模型(如GPT-3、PaLM和视觉转换器)的训练和服务。本教程还包括如何使用最新的开源系统工具集来支持大模型的训练和服务。我们希望通过这个教程，降低在ML研究中使用大模型的技术壁垒，把大模型带给大众。

https://icml.cc/Conferences/2022/Schedule?showEvent=18440

讲者介绍：

Hao Zhang目前是加州大学伯克利分校的博士后研究员，与Ion Stoica合作。他最近致力于为大规模分布式深度学习构建端到端可组合和自动化系统。

Zheng Lianmin是加州大学伯克利分校EECS系的博士生，他的导师是Ion Stoica和Joseph E. Gonzalez。他的研究兴趣在于机器学习和编程系统的交叉，特别是加速和可扩展的深度学习领域特定的编译器。

Zhuohan Li，加州大学伯克利分校计算机科学博士，导师是Ion Stoica。他的兴趣在于机器学习和分布式系统的交叉。他利用不同领域的见解来提高当前机器学习模型的性能(准确性、效率和可解释性)。

Ion Stoica是加州大学伯克利分校EECS系的教授 。他研究云计算和网络计算机系统。过去的工作包括Apache Spark, Apache Mesos, Tachyon, Chord DHT和动态包状态(DPS)。他是ACM Fellow，并获得了许多奖项，包括SIGOPS名人堂奖(2015年)，SIGCOMM时间测试奖(2011年)，和ACM博士论文奖(2001年)。2013年，他与人共同创立了一家名为Databricks的创业公司，致力于将大数据处理技术商业化。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“BM176” 就可以获取《ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

0

相关内容

大模型

大模型是基于海量多源数据打造的预训练模型，是对原有算法模型的技术升级和产品迭代，用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习，以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

专知会员服务

60+阅读 · 2022年7月24日

少样本NLP？ Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术，附328页ppt

少样本NLP？ Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术，附328页ppt

专知会员服务

55+阅读 · 2022年5月26日

ACL2022开会了！DeepMind学者等《视觉语言预训练:当前趋势与未来》教程，阐述最新前沿技术，附Slides

ACL2022开会了！DeepMind学者等《视觉语言预训练:当前趋势与未来》教程，阐述最新前沿技术，附Slides

专知会员服务

50+阅读 · 2022年5月22日

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

79+阅读 · 2021年7月23日

【ICML2021】计算机视觉中的自注意力机制，谷歌伯克利166页ppt教程

专知会员服务

135+阅读 · 2021年7月22日

如何加速深度神经网络计算效率？看NVIDIA-ISSCC2021教程，附Slides与视频

如何加速深度神经网络计算效率？看NVIDIA-ISSCC2021教程，附Slides与视频

专知会员服务

34+阅读 · 2021年3月25日

【AAAI2021】预训练语言模型最新进展，附113页ppt和视频

【AAAI2021】预训练语言模型最新进展，附113页ppt和视频

专知会员服务

65+阅读 · 2021年2月23日

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

专知会员服务

50+阅读 · 2020年10月18日

【硬核课】分布式深度学习，93页ppt概述最新DDL技术发展

【硬核课】分布式深度学习，93页ppt概述最新DDL技术发展

专知会员服务

96+阅读 · 2020年6月8日

【课程】伯克利2019全栈深度学习课程（附下载）

【课程】伯克利2019全栈深度学习课程（附下载）

专知会员服务

57+阅读 · 2019年10月29日

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

专知

2+阅读 · 2022年7月25日

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知

1+阅读 · 2022年7月22日

328页ppt! Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术

328页ppt! Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术

专知

3+阅读 · 2022年5月26日

GNN2022研究进展如何？CMU-Yoon112页PPT《图神经网络导论》，阐述GNN基本概念原理与研究进展，附ppt与视频

GNN2022研究进展如何？CMU-Yoon112页PPT《图神经网络导论》，阐述GNN基本概念原理与研究进展，附ppt与视频

专知

1+阅读 · 2022年4月19日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

专知

17+阅读 · 2019年6月3日

《AutoML：方法，系统，挑战》新书免费下载

《AutoML：方法，系统，挑战》新书免费下载

新智元

24+阅读 · 2019年5月28日

【干货】伯克利2019全栈深度学习课程（附下载）

【干货】伯克利2019全栈深度学习课程（附下载）

专知

26+阅读 · 2019年4月28日

自然语言处理(NLP)前沿进展报告（PPT下载）

自然语言处理(NLP)前沿进展报告（PPT下载）

专知

23+阅读 · 2018年9月29日

大型射电望远镜重力模型构建关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光线追迹的大口径天文望远镜快速装调方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

海量众包数据管理的关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

数据质量管理中的完整性约束关键技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

面向云服务的网络协同工作环境关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向多承租的弹性缓存服务关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

ERP3.0:企业平行管理系统理论与关键技术研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于对等网络的云计算资源共享模型及其关键技术的研究

国家自然科学基金

0+阅读 · 2011年12月31日

普适存储服务模型及其关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

The Role of Explanatory Value in Natural Language Processing

Arxiv

0+阅读 · 2022年9月13日

TDB: Breaking All Hop-Constrained Cycles in Billion-Scale Directed Graphs

Arxiv

0+阅读 · 2022年9月13日

Classical Verification of Quantum Computations in Linear Time

Arxiv

0+阅读 · 2022年9月13日

Deep Neural Networks as Complex Networks

Arxiv

0+阅读 · 2022年9月12日

Open-Domain Dialog Evaluation using Follow-Ups Likelihood

Arxiv

0+阅读 · 2022年9月12日

A Survey in Automatic Irony Processing: Linguistic, Cognitive, and Multi-X Perspectives

Arxiv

0+阅读 · 2022年9月10日

Energy-Efficiency Evaluation of OpenMP Loop Transformations and Runtime Constructs

Energy-Efficiency Evaluation of OpenMP Loop Transformations and Runtime Constructs

Arxiv

0+阅读 · 2022年9月9日

Towards a Recommender System for Profiling Users in a Renewable Energetic Community

Arxiv

0+阅读 · 2022年9月6日

Multimodal Learning with Transformers: A Survey

Arxiv

69+阅读 · 2022年6月13日

Scene Text Detection and Recognition: The Deep Learning Era

Scene Text Detection and Recognition: The Deep Learning Era

Arxiv

27+阅读 · 2019年9月5日

VIP会员

相关主题

相关VIP内容

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

专知会员服务

60+阅读 · 2022年7月24日

少样本NLP？ Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术，附328页ppt

少样本NLP？ Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术，附328页ppt

专知会员服务

55+阅读 · 2022年5月26日

ACL2022开会了！DeepMind学者等《视觉语言预训练:当前趋势与未来》教程，阐述最新前沿技术，附Slides

ACL2022开会了！DeepMind学者等《视觉语言预训练:当前趋势与未来》教程，阐述最新前沿技术，附Slides

专知会员服务

50+阅读 · 2022年5月22日

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

79+阅读 · 2021年7月23日

【ICML2021】计算机视觉中的自注意力机制，谷歌伯克利166页ppt教程

专知会员服务

135+阅读 · 2021年7月22日

如何加速深度神经网络计算效率？看NVIDIA-ISSCC2021教程，附Slides与视频

如何加速深度神经网络计算效率？看NVIDIA-ISSCC2021教程，附Slides与视频

专知会员服务

34+阅读 · 2021年3月25日

【AAAI2021】预训练语言模型最新进展，附113页ppt和视频

【AAAI2021】预训练语言模型最新进展，附113页ppt和视频

专知会员服务

65+阅读 · 2021年2月23日

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

专知会员服务

50+阅读 · 2020年10月18日

【硬核课】分布式深度学习，93页ppt概述最新DDL技术发展

【硬核课】分布式深度学习，93页ppt概述最新DDL技术发展

专知会员服务

96+阅读 · 2020年6月8日

【课程】伯克利2019全栈深度学习课程（附下载）

【课程】伯克利2019全栈深度学习课程（附下载）

专知会员服务

57+阅读 · 2019年10月29日

热门VIP内容

开通专知VIP会员享更多权益服务

【ICCV2025教程】基础模型遇见具身智能体

军事机器学习设计：关于开发自动化任务摘要系统的梯次化设计科学研究 | 2025最新93页

扩散模型中的缓存方法综述：迈向高效的多模态生成

【ICCV2025教程】《迈向视觉语言模型的全面推理》

相关资讯

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

专知

2+阅读 · 2022年7月25日

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知

1+阅读 · 2022年7月22日

328页ppt! Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术

328页ppt! Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术

专知

3+阅读 · 2022年5月26日

GNN2022研究进展如何？CMU-Yoon112页PPT《图神经网络导论》，阐述GNN基本概念原理与研究进展，附ppt与视频

GNN2022研究进展如何？CMU-Yoon112页PPT《图神经网络导论》，阐述GNN基本概念原理与研究进展，附ppt与视频

专知

1+阅读 · 2022年4月19日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

专知

17+阅读 · 2019年6月3日

《AutoML：方法，系统，挑战》新书免费下载

《AutoML：方法，系统，挑战》新书免费下载

新智元

24+阅读 · 2019年5月28日

【干货】伯克利2019全栈深度学习课程（附下载）

【干货】伯克利2019全栈深度学习课程（附下载）

专知

26+阅读 · 2019年4月28日

自然语言处理(NLP)前沿进展报告（PPT下载）

自然语言处理(NLP)前沿进展报告（PPT下载）

专知

23+阅读 · 2018年9月29日

相关基金

大型射电望远镜重力模型构建关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光线追迹的大口径天文望远镜快速装调方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

海量众包数据管理的关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

数据质量管理中的完整性约束关键技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

面向云服务的网络协同工作环境关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向多承租的弹性缓存服务关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

ERP3.0:企业平行管理系统理论与关键技术研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于对等网络的云计算资源共享模型及其关键技术的研究

国家自然科学基金

0+阅读 · 2011年12月31日

普适存储服务模型及其关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

The Role of Explanatory Value in Natural Language Processing

Arxiv

0+阅读 · 2022年9月13日

TDB: Breaking All Hop-Constrained Cycles in Billion-Scale Directed Graphs

Arxiv

0+阅读 · 2022年9月13日

Classical Verification of Quantum Computations in Linear Time

Arxiv

0+阅读 · 2022年9月13日

Deep Neural Networks as Complex Networks

Arxiv

0+阅读 · 2022年9月12日

Open-Domain Dialog Evaluation using Follow-Ups Likelihood

Arxiv

0+阅读 · 2022年9月12日

A Survey in Automatic Irony Processing: Linguistic, Cognitive, and Multi-X Perspectives

Arxiv

0+阅读 · 2022年9月10日

Energy-Efficiency Evaluation of OpenMP Loop Transformations and Runtime Constructs

Energy-Efficiency Evaluation of OpenMP Loop Transformations and Runtime Constructs

Arxiv

0+阅读 · 2022年9月9日

Towards a Recommender System for Profiling Users in a Renewable Energetic Community

Arxiv

0+阅读 · 2022年9月6日

Multimodal Learning with Transformers: A Survey

Arxiv

69+阅读 · 2022年6月13日

Scene Text Detection and Recognition: The Deep Learning Era

Scene Text Detection and Recognition: The Deep Learning Era

Arxiv

27+阅读 · 2019年9月5日

大家都在搜

2025最新文献

NTU博士论文

国防科技创新

蓝牙安全攻防

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员