会员服务 ·

0

机器学习三个时代的计算趋势

2022 年 4 月 21 日 InfoQ

作者 | Annu Kumari

译者 | Phoenix

策划 | 凌敏

决定现代机器学习发展的三个基础是计算、数据和算法进化 (ML，机器学习)，本文着眼于最易量化的元素的趋势。

在 2010 年之前，训练计算的发展与摩尔定律同步，每两年一翻；自 2010 年代初，引入深度学习以来，训练计算的速度已经加快，大约每六个月增加一倍；2015 年末，出现了一种新的趋势。

基于这些观察，机器学习的计算历史被划分为三个时代——前深度学习时代、深度学习时代和大规模时代。本文总结了用于训练高级机器学习系统快速增长的计算需求。

趋势

比较是在一个由 123 个里程碑式的机器学习系统组成的数据集上进行的，并标注了训练它们所需的计算量。在深度学习起步之前，有一段进展缓慢的时间，这种趋势在 2010 年加速，此后一直没有放缓。另外，在 2015 年和 2016 年，出现了大规模模型的新趋势，以比上一个时代快两个数量级的速度扩张。

来源：http://arxiv.org/pdf/2202.05924.pdf

过渡到深度学习

在深度学习出现之前和之后，人们注意到了两种不同的趋势机制。

此前，训练机器学习算法所需的算力是每 17 至 29 个月翻一番。之后，整体趋势加快速，每 4 到 9 个月翻一番。

根据摩尔定律，晶体管密度每两年翻一番（Moore，1965 年），通常简化为计算性能每两年翻一番——基本上符合前深度学习时代的趋势。目前尚不清楚深度学习时代何时开始，从前深度学习到深度学习时代的过渡没有明显的间断。此外，无论深度学习时代始于 2010 年还是 2012 年，结果几乎都不会改变。

来源：http://arxiv.org/pdf/2202.05924.pdf

大规模深度时代的趋势

数据显示，大规模型模型的新趋势始于 2015-2016 年，这种新趋势始于 2015 年底的 AlphaGo，一直持续到现在，大规模模型是由大公司训练的，更高的训练预算可能是打破先前的趋势的原因。

另外，常规规模模型受欢迎的程度并未受到影响，这一趋势在 2016 年之前和之后是相同的速度，每 5 到 6 个月翻一番，如下表所示。大规模模型的计算量增加的趋势明显放缓，每 9 到 10 个月翻一番。由于这些模型的数据有限，明显放缓可能是噪声的结果。

这一发现与 Amodei & Hernandez (2018) 和 Lyzhov (2021) 形成对比，前者发现 2012 年至 2018 年的倍增期为 3.4 个月，后者发现 2018 年至 2020 年的倍增期超过 2 年。以前的评估无法区分这两个独立的模式，因为大规模的趋势是最近才发展起来的。

来源：http://arxiv.org/pdf/2202.05924.pdf

结论

研究结果与早期研究一致，这显示了训练计算更适度的规模。1952 年到 2010 年有 18 个月的倍增时间，2010 年到 2022 年有 6 个月的倍增时间，从 2015 年末到 2022 年的大规模新趋势，快了 2 到 3 个数量级，倍增时间为 10 个月。

总而言之，在前深度学习时代，计算进展缓慢，随着 2010 年进入深度学习时代，这种趋势加速了。在 2015 年底，企业开始生产优于趋势的大规模模型，如 AlphaGo，标志着大规模时代的开始。然而，这并不能确定区分大规模和常规规模的模型而形成模式。

在计算机教学中，硬件基础设施和工程师的作用越来越大，凸显了两者的战略必要性。获得巨大的计算预算或计算集群，以及应用它们的专业知识，已经成为前沿机器学习研究的代名词。

原文链接：

https://www.marktechpost.com/2022/03/18/this-research-paper-explain-the-compute-trends-across-three-eras-of-machine-learning/

点击底部阅读原文访问 InfoQ 官网，获取更多精彩内容！

今日好文推荐

自由软件之父抨击苹果电脑变成“监狱”，不建议用Ubuntu

今天的应用架构，正处在一个不可测的阶段

2022 年 Java 将何去何从？

华为前员工利用bug越权访问获利，被判一年；马斯克拟全资收购推特后将代码放到GitHub；阿里云人事大变动 | Q资讯

活动推荐

参与写作社区 2 周年庆典活动！500 份周年定制礼包等你来拿～还有机会赢取苹果电脑、Switch 游戏机等多重好礼！

点个在看少个 bug 👇

登录查看更多

0

相关内容

机器学习

“机器学习是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与统计推断学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。很多推论问题属于无程序可循难度，所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

「计算机视觉」2022 年 5 大趋势

「计算机视觉」2022 年 5 大趋势

专知会员服务

76+阅读 · 2022年3月27日

【经典书】机器学习统计学，476页pdf

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

机器学习的可解释性

机器学习的可解释性

专知会员服务

69+阅读 · 2020年12月18日

经济学中的数据科学：机器学习与深度学习方法

经济学中的数据科学：机器学习与深度学习方法

专知会员服务

27+阅读 · 2020年10月19日

【NLP| 推荐文章】神经网络方法的机器阅读理解：方法与趋势（Neural Machine Reading Comprehension：Methods and Trends）

专知会员服务

41+阅读 · 2019年11月24日

【科普】吴飞教授：《走进人工智能》---第11讲黄氏定律：人工智能算力增长速度

【科普】吴飞教授：《走进人工智能》---第11讲黄氏定律：人工智能算力增长速度

中国图象图形学学会CSIG

0+阅读 · 2022年4月22日

总结机器学习3个时代的算力规律：大模型的出现改变了什么？

总结机器学习3个时代的算力规律：大模型的出现改变了什么？

大数据文摘

1+阅读 · 2022年4月6日

2010年以来，ML算力需求增长100亿倍，每6个月翻番，深度学习成分水岭

2010年以来，ML算力需求增长100亿倍，每6个月翻番，深度学习成分水岭

机器之心

0+阅读 · 2022年3月15日

AI训练的效率正在超越摩尔定律

AI训练的效率正在超越摩尔定律

AI前线

0+阅读 · 2022年2月23日

物理系统执行机器学习计算，一种使用反向传播训练的深度物理神经网络

物理系统执行机器学习计算，一种使用反向传播训练的深度物理神经网络

机器之心

1+阅读 · 2022年1月30日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

随机门设计及其体系结构在机器学习中的应用

国家自然科学基金

4+阅读 · 2014年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

氦在钨中扩散、融合和释放的多尺度模拟

国家自然科学基金

0+阅读 · 2013年12月31日

云环境下面向大数据并行计算的工作流执行优化研究

国家自然科学基金

1+阅读 · 2012年12月31日

Meta Optimal Transport

Arxiv

0+阅读 · 2022年6月10日

Scalable Computations for Nonstationary Gaussian Processes

Scalable Computations for Nonstationary Gaussian Processes

Arxiv

0+阅读 · 2022年6月10日

An Iterative Labeling Method for Annotating Fisheries Imagery

Arxiv

0+阅读 · 2022年6月8日

Arxiv

0+阅读 · 2022年6月1日

Causality and Generalizability: Identifiability and Learning Methods

Arxiv

12+阅读 · 2021年10月4日

VIP会员

相关主题

机器学习系统

高级机器学习

相关VIP内容

「计算机视觉」2022 年 5 大趋势

「计算机视觉」2022 年 5 大趋势

专知会员服务

76+阅读 · 2022年3月27日

【经典书】机器学习统计学，476页pdf

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

机器学习的可解释性

机器学习的可解释性

专知会员服务

69+阅读 · 2020年12月18日

经济学中的数据科学：机器学习与深度学习方法

经济学中的数据科学：机器学习与深度学习方法

专知会员服务

27+阅读 · 2020年10月19日

【NLP| 推荐文章】神经网络方法的机器阅读理解：方法与趋势（Neural Machine Reading Comprehension：Methods and Trends）

专知会员服务

41+阅读 · 2019年11月24日

热门VIP内容

开通专知VIP会员享更多权益服务

大模型推理时代的知识编辑

《利用人工智能对军事行动进行建模》

【MIT博士论文】加速科学发现的因果建模实践算法

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

相关资讯

【科普】吴飞教授：《走进人工智能》---第11讲黄氏定律：人工智能算力增长速度

【科普】吴飞教授：《走进人工智能》---第11讲黄氏定律：人工智能算力增长速度

中国图象图形学学会CSIG

0+阅读 · 2022年4月22日

总结机器学习3个时代的算力规律：大模型的出现改变了什么？

总结机器学习3个时代的算力规律：大模型的出现改变了什么？

大数据文摘

1+阅读 · 2022年4月6日

2010年以来，ML算力需求增长100亿倍，每6个月翻番，深度学习成分水岭

2010年以来，ML算力需求增长100亿倍，每6个月翻番，深度学习成分水岭

机器之心

0+阅读 · 2022年3月15日

AI训练的效率正在超越摩尔定律

AI训练的效率正在超越摩尔定律

AI前线

0+阅读 · 2022年2月23日

物理系统执行机器学习计算，一种使用反向传播训练的深度物理神经网络

物理系统执行机器学习计算，一种使用反向传播训练的深度物理神经网络

机器之心

1+阅读 · 2022年1月30日

相关基金

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

随机门设计及其体系结构在机器学习中的应用

国家自然科学基金

4+阅读 · 2014年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

氦在钨中扩散、融合和释放的多尺度模拟

国家自然科学基金

0+阅读 · 2013年12月31日

云环境下面向大数据并行计算的工作流执行优化研究

国家自然科学基金

1+阅读 · 2012年12月31日

相关论文

Meta Optimal Transport

Arxiv

0+阅读 · 2022年6月10日

Scalable Computations for Nonstationary Gaussian Processes

Scalable Computations for Nonstationary Gaussian Processes

Arxiv

0+阅读 · 2022年6月10日

An Iterative Labeling Method for Annotating Fisheries Imagery

Arxiv

0+阅读 · 2022年6月8日

Arxiv

0+阅读 · 2022年6月1日

Causality and Generalizability: Identifiability and Learning Methods

Arxiv

12+阅读 · 2021年10月4日

大家都在搜

朱克爱德华兹家族

大型语言模型

蓝牙安全攻防

滴滴司机调度系统实践

微信扫码咨询专知VIP会员