【AAAI2023教程】大规模深度学习优化技术，109页ppt - 专知VIP

会员服务 ·

31

AAAI 2023 · 深度学习优化 ·

2023 年 2 月 10 日

【AAAI2023教程】大规模深度学习优化技术，109页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

第37届国际人工智能大会（AAAI2023）于2023年2月7日-2月14日在美国华盛顿召开。AAAI是CCF推荐的A类国际学术会议，在人工智能领域享有很高的学术声誉。这次会议共收到来自8777篇投稿，录用1721篇，录用率约19.6%。来自伯克利、NUS等学者带来了《大规模深度学习优化技术》教程，非常值得关注！

大型transformer模型在广泛的人工智能应用中表现出了有希望的性能。然而，由于其良好的性能，最近出现了大量超大型模型。由于大量的通信开销和它们执行的计算数量，这些模型具有过高的训练成本。因此，学术界和工业界都在更大的集群上扩展深度学习训练。然而，泛化性能的下降、不可忽视的通信开销和模型大小的增加阻碍了深度学习研究人员和工程师探索大规模人工智能模型。**在本教程中，我们的目标是提供一个关于模型精度和模型效率的大规模深度学习优化的清晰草图。**本文研究了最常用于优化的算法:回顾了梯度下降优化的关键思想，介绍了大批量训练优化，详细阐述了在大批量训练中出现的泛化差距这一有争议的主题，提出了二阶优化，最后，回顾了解决通信开销和减少内存占用的最先进策略。

成为VIP会员查看完整内容

61

相关内容

AAAI 2023

「图神经网络:基础、前沿与应用」最新AAAI2023教程，209页ppt全面阐述GNN最新进展

「图神经网络:基础、前沿与应用」最新AAAI2023教程，209页ppt全面阐述GNN最新进展

专知会员服务

126+阅读 · 2023年2月11日

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

专知会员服务

24+阅读 · 2022年7月29日

AAAI2022最新「人工智能规划」教程报告，120页PPT阐述AI规划理论与实践进展

AAAI2022最新「人工智能规划」教程报告，120页PPT阐述AI规划理论与实践进展

专知会员服务

94+阅读 · 2022年3月6日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【UAI2021教程】贝叶斯最优学习，65页ppt

【UAI2021教程】贝叶斯最优学习，65页ppt

专知会员服务

65+阅读 · 2021年8月7日

【IJCAI】大规模可扩展深度学习，82页ppt

【IJCAI】大规模可扩展深度学习，82页ppt

专知会员服务

29+阅读 · 2021年1月10日

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

专知会员服务

95+阅读 · 2020年10月18日

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

专知会员服务

131+阅读 · 2020年9月29日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【WWW2020】可解释人工智能(XAI): 工业界挑战与经验教训，180页ppt

【WWW2020】可解释人工智能(XAI): 工业界挑战与经验教训，180页ppt

专知会员服务

261+阅读 · 2020年4月23日

【AAAI2023】图序注意力网络

【AAAI2023】图序注意力网络

专知

6+阅读 · 2022年11月24日

NeurIPS 2022 | 商汤提出大批量训练算法，四分钟内训练目标检测器

NeurIPS 2022 | 商汤提出大批量训练算法，四分钟内训练目标检测器

PaperWeekly

1+阅读 · 2022年11月16日

太强了! VLDB'22最佳论文：GNN高效训练

太强了! VLDB'22最佳论文：GNN高效训练

图与推荐

0+阅读 · 2022年10月13日

谷歌大脑《自动强化学习》教程，81页ppt!

谷歌大脑《自动强化学习》教程，81页ppt!

专知

0+阅读 · 2022年8月15日

IJCAI2022《对抗序列决策》教程，164页ppt

IJCAI2022《对抗序列决策》教程，164页ppt

专知

4+阅读 · 2022年7月27日

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

专知

0+阅读 · 2022年7月14日

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

专知

16+阅读 · 2020年10月13日

【KDD2019】TensorFlow 2.0+NLP 最新实操教程，Google AI 130页PPT+代码

【KDD2019】TensorFlow 2.0+NLP 最新实操教程，Google AI 130页PPT+代码

专知

16+阅读 · 2019年8月20日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

27+阅读 · 2019年4月16日

246 页《统计机器学习与凸优化》教程 PPT 下载

246 页《统计机器学习与凸优化》教程 PPT 下载

新智元

25+阅读 · 2018年9月21日

大规模参数估计的约束无导数优化信赖域方法

国家自然科学基金

1+阅读 · 2015年12月31日

大规模在线课程中用户流失问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

大规模RFID阅读器部署技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

时频双选信道中基于变分推理的迭代接收技术

国家自然科学基金

0+阅读 · 2012年12月31日

并行子空间学习方法及其大规模图像识别应用研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于锥模型拟牛顿公式的大规模优化方法及其应用

国家自然科学基金

0+阅读 · 2011年12月31日

机器学习核方法模型选择与组合的核矩阵近似分析方法

国家自然科学基金

0+阅读 · 2011年12月31日

矩阵分解的低延迟并行算法

国家自然科学基金

0+阅读 · 2009年12月31日

大规模稀疏学习及其应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

大型稀疏非对称线性方程组的预处理及高效算法研究

国家自然科学基金

0+阅读 · 2009年12月31日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

479+阅读 · 2023年3月31日

A Survey on Automated Program Repair Techniques

Arxiv

0+阅读 · 2023年3月31日

Accounting for Vibration Noise in Stochastic Measurement Errors

Arxiv

0+阅读 · 2023年3月31日

Fused Depthwise Tiling for Memory Optimization in TinyML Deep Neural Network Inference

Arxiv

0+阅读 · 2023年3月31日

A Survey on Uncertainty Reasoning and Quantification for Decision Making: Belief Theory Meets Deep Learning

Arxiv

30+阅读 · 2022年6月12日

A Survey of Uncertainty in Deep Neural Networks

Arxiv

30+阅读 · 2021年7月7日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Self-supervised Geometric Perception

Arxiv

24+阅读 · 2021年3月4日

已删除

Arxiv

32+阅读 · 2020年3月23日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

VIP会员

相关主题

深度学习优化

相关VIP内容

「图神经网络:基础、前沿与应用」最新AAAI2023教程，209页ppt全面阐述GNN最新进展

「图神经网络:基础、前沿与应用」最新AAAI2023教程，209页ppt全面阐述GNN最新进展

专知会员服务

126+阅读 · 2023年2月11日

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

专知会员服务

24+阅读 · 2022年7月29日

AAAI2022最新「人工智能规划」教程报告，120页PPT阐述AI规划理论与实践进展

AAAI2022最新「人工智能规划」教程报告，120页PPT阐述AI规划理论与实践进展

专知会员服务

94+阅读 · 2022年3月6日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【UAI2021教程】贝叶斯最优学习，65页ppt

【UAI2021教程】贝叶斯最优学习，65页ppt

专知会员服务

65+阅读 · 2021年8月7日

【IJCAI】大规模可扩展深度学习，82页ppt

【IJCAI】大规模可扩展深度学习，82页ppt

专知会员服务

29+阅读 · 2021年1月10日

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

专知会员服务

95+阅读 · 2020年10月18日

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

微软东昱晓《图表示学习: 嵌入，GNNs与预训练》2020教程，100页ppt

专知会员服务

131+阅读 · 2020年9月29日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【WWW2020】可解释人工智能(XAI): 工业界挑战与经验教训，180页ppt

【WWW2020】可解释人工智能(XAI): 工业界挑战与经验教训，180页ppt

专知会员服务

261+阅读 · 2020年4月23日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

【AAAI2023】图序注意力网络

【AAAI2023】图序注意力网络

专知

6+阅读 · 2022年11月24日

NeurIPS 2022 | 商汤提出大批量训练算法，四分钟内训练目标检测器

NeurIPS 2022 | 商汤提出大批量训练算法，四分钟内训练目标检测器

PaperWeekly

1+阅读 · 2022年11月16日

太强了! VLDB'22最佳论文：GNN高效训练

太强了! VLDB'22最佳论文：GNN高效训练

图与推荐

0+阅读 · 2022年10月13日

谷歌大脑《自动强化学习》教程，81页ppt!

谷歌大脑《自动强化学习》教程，81页ppt!

专知

0+阅读 · 2022年8月15日

IJCAI2022《对抗序列决策》教程，164页ppt

IJCAI2022《对抗序列决策》教程，164页ppt

专知

4+阅读 · 2022年7月27日

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

专知

0+阅读 · 2022年7月14日

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

专知

16+阅读 · 2020年10月13日

【KDD2019】TensorFlow 2.0+NLP 最新实操教程，Google AI 130页PPT+代码

【KDD2019】TensorFlow 2.0+NLP 最新实操教程，Google AI 130页PPT+代码

专知

16+阅读 · 2019年8月20日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

27+阅读 · 2019年4月16日

246 页《统计机器学习与凸优化》教程 PPT 下载

246 页《统计机器学习与凸优化》教程 PPT 下载

新智元

25+阅读 · 2018年9月21日

相关基金

大规模参数估计的约束无导数优化信赖域方法

国家自然科学基金

1+阅读 · 2015年12月31日

大规模在线课程中用户流失问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

大规模RFID阅读器部署技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

时频双选信道中基于变分推理的迭代接收技术

国家自然科学基金

0+阅读 · 2012年12月31日

并行子空间学习方法及其大规模图像识别应用研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于锥模型拟牛顿公式的大规模优化方法及其应用

国家自然科学基金

0+阅读 · 2011年12月31日

机器学习核方法模型选择与组合的核矩阵近似分析方法

国家自然科学基金

0+阅读 · 2011年12月31日

矩阵分解的低延迟并行算法

国家自然科学基金

0+阅读 · 2009年12月31日

大规模稀疏学习及其应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

大型稀疏非对称线性方程组的预处理及高效算法研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

479+阅读 · 2023年3月31日

A Survey on Automated Program Repair Techniques

Arxiv

0+阅读 · 2023年3月31日

Accounting for Vibration Noise in Stochastic Measurement Errors

Arxiv

0+阅读 · 2023年3月31日

Fused Depthwise Tiling for Memory Optimization in TinyML Deep Neural Network Inference

Arxiv

0+阅读 · 2023年3月31日

A Survey on Uncertainty Reasoning and Quantification for Decision Making: Belief Theory Meets Deep Learning

Arxiv

30+阅读 · 2022年6月12日

A Survey of Uncertainty in Deep Neural Networks

Arxiv

30+阅读 · 2021年7月7日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Self-supervised Geometric Perception

Arxiv

24+阅读 · 2021年3月4日

已删除

Arxiv

32+阅读 · 2020年3月23日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

微信扫码咨询专知VIP会员