深度学习效率进展的细致指南 - 专知VIP

会员服务 ·

14

深度学习 ·

深度学习效率进展的细致指南

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文提供了从效率角度出发的深度学习进展的全面时间顺序指南：涵盖了集群、独立硬件、深度学习库、编译器，甚至架构的变化。本文并非一篇综述论文，旨在为读者提供对该领域的广泛直观理解——在过去 40 年中涌现的每一个细节都不可能全部涵盖。前言：在过去十年中，深度学习领域蓬勃发展，发展到无论是研究人员还是学生都很难跟踪其动态的程度。有时，我甚至发现自己难以把握该领域的实际方向。在这个常常显得飘忽不定的领域，许多方法和结果在实际中显得差强人意，我希望至少对我们当前所处的进展有一个概念。我希望以叙述的形式写这篇文章——1）使其对读者易于理解，而不是信息过载；2）让读者从宏观视角审视该领域，并理解其演变轨迹。我尽量以论文为中心（类似于 Lilian Weng 风格的博客！），并包含了我认为适当的标志性（或酷炫）作品；如果读者觉得需要包含或修改某些内容，请随时告知！在开始之前，让我先列出一些相关的数字，以帮助大家更好地了解即将讨论的进展。对于不熟悉这些数字的朋友，我也添加了一些说明。

NVIDIA 最新的 Blackwell B200 GPU 估计售价为 3 万至 4 万美元。
对于 FP8，它的性能可达约 4500 TeraFLOPS，性能非常惊人！
它配备了 192GB 的高带宽内存/DRAM，这是主要的 GPU 内存。
Llama 3.1 405B，Meta 最新的开源语言模型，参数量达 4050 亿（约 800GB）。
它的训练使用了高达 16000 张 NVIDIA H100（位于 24000 GPU 集群上）。
它的训练数据集包含了 15 万亿个 token。

成为VIP会员查看完整内容

28

相关内容

《多模态对齐与融合》综述

《多模态对齐与融合》综述

专知会员服务

68+阅读 · 11月27日

多模态持续学习的最新进展：综合综述

多模态持续学习的最新进展：综合综述

专知会员服务

40+阅读 · 10月10日

多模态情感计算的最新趋势：来自自然语言处理视角的综述

多模态情感计算的最新趋势：来自自然语言处理视角的综述

专知会员服务

26+阅读 · 9月16日

生成式人工智能手册：学习资源路线图

生成式人工智能手册：学习资源路线图

专知会员服务

58+阅读 · 6月6日

面向资源受限环境的轻量级深度学习:综述

面向资源受限环境的轻量级深度学习:综述

专知会员服务

50+阅读 · 4月13日

有监督深度学习的优化方法研究综述

有监督深度学习的优化方法研究综述

专知会员服务

39+阅读 · 2023年5月15日

基于表格数据的深度学习方法

基于表格数据的深度学习方法

专知会员服务

37+阅读 · 2021年10月19日

深度学习的轻量化神经网络结构研究综述

专知会员服务

55+阅读 · 2021年10月4日

深度学习的对抗攻击与防御方法综述

专知会员服务

97+阅读 · 2020年12月8日

【强化学习最新综述】详解强化学习当前进展及未来方向

专知会员服务

235+阅读 · 2020年1月23日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

23+阅读 · 2019年5月19日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

TensorFlow 2.0深度强化学习指南

TensorFlow 2.0深度强化学习指南

云栖社区

18+阅读 · 2019年2月1日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

40+阅读 · 2019年1月22日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

数据派THU

17+阅读 · 2018年9月23日

综述 | 近年来深度学习的重要研究成果（附PDF）

综述 | 近年来深度学习的重要研究成果（附PDF）

数据派THU

14+阅读 · 2018年8月15日

深度学习综述（下载PDF版）

深度学习综述（下载PDF版）

机器学习算法与Python学习

27+阅读 · 2018年7月3日

10个深度学习软件的安装指南（附代码）

10个深度学习软件的安装指南（附代码）

数据派THU

17+阅读 · 2017年11月18日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

25+阅读 · 2015年12月31日

基于多源异构不确定数据的高效用信息挖掘的研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

20+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向大规模分布式一致性最优化问题的结构型一阶求解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

12+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

金融大数据随机建模中若干非马氏问题及其应用的研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

159+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

183+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

71+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

408+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

129+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

58+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

68+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

148+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

45+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

21+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

《多模态对齐与融合》综述

《多模态对齐与融合》综述

专知会员服务

68+阅读 · 11月27日

多模态持续学习的最新进展：综合综述

多模态持续学习的最新进展：综合综述

专知会员服务

40+阅读 · 10月10日

多模态情感计算的最新趋势：来自自然语言处理视角的综述

多模态情感计算的最新趋势：来自自然语言处理视角的综述

专知会员服务

26+阅读 · 9月16日

生成式人工智能手册：学习资源路线图

生成式人工智能手册：学习资源路线图

专知会员服务

58+阅读 · 6月6日

面向资源受限环境的轻量级深度学习:综述

面向资源受限环境的轻量级深度学习:综述

专知会员服务

50+阅读 · 4月13日

有监督深度学习的优化方法研究综述

有监督深度学习的优化方法研究综述

专知会员服务

39+阅读 · 2023年5月15日

基于表格数据的深度学习方法

基于表格数据的深度学习方法

专知会员服务

37+阅读 · 2021年10月19日

深度学习的轻量化神经网络结构研究综述

专知会员服务

55+阅读 · 2021年10月4日

深度学习的对抗攻击与防御方法综述

专知会员服务

97+阅读 · 2020年12月8日

【强化学习最新综述】详解强化学习当前进展及未来方向

专知会员服务

235+阅读 · 2020年1月23日

热门VIP内容

相关资讯

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

23+阅读 · 2019年5月19日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

TensorFlow 2.0深度强化学习指南

TensorFlow 2.0深度强化学习指南

云栖社区

18+阅读 · 2019年2月1日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

40+阅读 · 2019年1月22日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

数据派THU

17+阅读 · 2018年9月23日

综述 | 近年来深度学习的重要研究成果（附PDF）

综述 | 近年来深度学习的重要研究成果（附PDF）

数据派THU

14+阅读 · 2018年8月15日

深度学习综述（下载PDF版）

深度学习综述（下载PDF版）

机器学习算法与Python学习

27+阅读 · 2018年7月3日

10个深度学习软件的安装指南（附代码）

10个深度学习软件的安装指南（附代码）

数据派THU

17+阅读 · 2017年11月18日

相关基金

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

25+阅读 · 2015年12月31日

基于多源异构不确定数据的高效用信息挖掘的研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

20+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向大规模分布式一致性最优化问题的结构型一阶求解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

12+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

金融大数据随机建模中若干非马氏问题及其应用的研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

159+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

183+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

71+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

408+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

129+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

58+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

68+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

148+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

45+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

21+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员