本文提供了从效率角度出发的深度学习进展的全面时间顺序指南:涵盖了集群、独立硬件、深度学习库、编译器,甚至架构的变化。本文并非一篇综述论文,旨在为读者提供对该领域的广泛直观理解——在过去 40 年中涌现的每一个细节都不可能全部涵盖。 前言:在过去十年中,深度学习领域蓬勃发展,发展到无论是研究人员还是学生都很难跟踪其动态的程度。有时,我甚至发现自己难以把握该领域的实际方向。在这个常常显得飘忽不定的领域,许多方法和结果在实际中显得差强人意,我希望至少对我们当前所处的进展有一个概念。 我希望以叙述的形式写这篇文章——1)使其对读者易于理解,而不是信息过载;2)让读者从宏观视角审视该领域,并理解其演变轨迹。我尽量以论文为中心(类似于 Lilian Weng 风格的博客!),并包含了我认为适当的标志性(或酷炫)作品;如果读者觉得需要包含或修改某些内容,请随时告知!在开始之前,让我先列出一些相关的数字,以帮助大家更好地了解即将讨论的进展。对于不熟悉这些数字的朋友,我也添加了一些说明。

  • NVIDIA 最新的 Blackwell B200 GPU 估计售价为 3 万至 4 万美元。
  • 对于 FP8,它的性能可达约 4500 TeraFLOPS,性能非常惊人!
  • 它配备了 192GB 的高带宽内存/DRAM,这是主要的 GPU 内存。
  • Llama 3.1 405B,Meta 最新的开源语言模型,参数量达 4050 亿(约 800GB)。
  • 它的训练使用了高达 16000 张 NVIDIA H100(位于 24000 GPU 集群上)。
  • 它的训练数据集包含了 15 万亿个 token。

成为VIP会员查看完整内容
28

相关内容

《多模态对齐与融合》综述
专知会员服务
68+阅读 · 11月27日
多模态持续学习的最新进展:综合综述
专知会员服务
40+阅读 · 10月10日
生成式人工智能手册:学习资源路线图
专知会员服务
58+阅读 · 6月6日
面向资源受限环境的轻量级深度学习:综述
专知会员服务
50+阅读 · 4月13日
有监督深度学习的优化方法研究综述
专知会员服务
39+阅读 · 2023年5月15日
基于表格数据的深度学习方法
专知会员服务
37+阅读 · 2021年10月19日
专知会员服务
55+阅读 · 2021年10月4日
专知会员服务
97+阅读 · 2020年12月8日
专知会员服务
235+阅读 · 2020年1月23日
深度学习人体姿态估计算法综述
AI前线
23+阅读 · 2019年5月19日
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
TensorFlow 2.0深度强化学习指南
云栖社区
18+阅读 · 2019年2月1日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
综述 | 近年来深度学习的重要研究成果(附PDF)
数据派THU
14+阅读 · 2018年8月15日
深度学习综述(下载PDF版)
机器学习算法与Python学习
27+阅读 · 2018年7月3日
10个深度学习软件的安装指南(附代码)
数据派THU
17+阅读 · 2017年11月18日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Arxiv
159+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
148+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关主题
相关VIP内容
《多模态对齐与融合》综述
专知会员服务
68+阅读 · 11月27日
多模态持续学习的最新进展:综合综述
专知会员服务
40+阅读 · 10月10日
生成式人工智能手册:学习资源路线图
专知会员服务
58+阅读 · 6月6日
面向资源受限环境的轻量级深度学习:综述
专知会员服务
50+阅读 · 4月13日
有监督深度学习的优化方法研究综述
专知会员服务
39+阅读 · 2023年5月15日
基于表格数据的深度学习方法
专知会员服务
37+阅读 · 2021年10月19日
专知会员服务
55+阅读 · 2021年10月4日
专知会员服务
97+阅读 · 2020年12月8日
专知会员服务
235+阅读 · 2020年1月23日
相关资讯
深度学习人体姿态估计算法综述
AI前线
23+阅读 · 2019年5月19日
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
TensorFlow 2.0深度强化学习指南
云栖社区
18+阅读 · 2019年2月1日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
综述 | 近年来深度学习的重要研究成果(附PDF)
数据派THU
14+阅读 · 2018年8月15日
深度学习综述(下载PDF版)
机器学习算法与Python学习
27+阅读 · 2018年7月3日
10个深度学习软件的安装指南(附代码)
数据派THU
17+阅读 · 2017年11月18日
相关基金
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员