题目:

Communication-Efficient Distributed Deep Learning: A Comprehensive Survey

简介:

随着深度模型和数据集规模的增加,通过利用多个计算设备(例如GPU / TPU)来减少总体训练时间,分布式深度学习变得非常普遍。但是,计算设备之间的数据通信可能是限制系统可伸缩性的潜在瓶颈。近年来,如何解决分布式深度学习中的交流问题成为研究的热点。在本文中,我们对系统级和算法级优化中的通信有效的分布式训练算法进行了全面的概述。在系统级,我们对系统的设计和实现进行神秘化处理以降低通信成本。在算法级别,我们将不同的算法与理论收敛范围和通信复杂性进行比较。具体来说,我们首先提出数据并行分布式训练算法的分类法,它包含四个主要方面:通信同步,系统架构,压缩技术以及通信和计算的并行性。然后,我们讨论解决四个维度问题的研究,以比较通信成本。我们进一步比较了不同算法的收敛速度,这使我们能够知道算法在迭代方面可以收敛到解决方案的速度。根据系统级通信成本分析和理论收敛速度的比较,我们为读者提供了在特定的分布式环境下哪种算法更有效的方法,并推断出可能的方向以进行进一步的优化。

成为VIP会员查看完整内容
43

相关内容

香港浸会大学(Hong Kong Baptist University),是一所国际化研究型博雅大学,为香港教资委资助的八所公立大学之一。浸大在 2021QS 世界年轻大学排名中位列全球第 23 名。浸大于 2022QS 世界大学排名中位列全球第 287 名。截至 2021 年,浸大在数据库领域位列世界第 13 位,在人工智能领域排名香港首位,世界第 37 位。计算机科学领域排名世界第 101-125 位,研究成果排名全港首位。
元学习(meta learning) 最新进展综述论文
专知会员服务
278+阅读 · 2020年5月8日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
131+阅读 · 2020年3月25日
专知会员服务
103+阅读 · 2020年3月12日
最新《分布式机器学习》论文综述最新DML进展,33页pdf
专知会员服务
118+阅读 · 2019年12月26日
【文献综述】边缘计算与深度学习的融合综述论文
专知会员服务
164+阅读 · 2019年12月26日
图神经网络概述第三弹:来自IEEE Fellow的GNN综述
机器之心
46+阅读 · 2019年1月7日
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
多媒体大数据分析研究进展综述导读
专知
8+阅读 · 2018年3月19日
Arxiv
101+阅读 · 2020年3月4日
A Comprehensive Survey on Transfer Learning
Arxiv
121+阅读 · 2019年11月7日
Arxiv
15+阅读 · 2019年6月25日
Deep Learning for Energy Markets
Arxiv
10+阅读 · 2019年4月10日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
73+阅读 · 2018年12月22日
Deep Learning for Generic Object Detection: A Survey
Arxiv
13+阅读 · 2018年9月6日
Arxiv
22+阅读 · 2018年8月30日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
VIP会员
相关论文
Arxiv
101+阅读 · 2020年3月4日
A Comprehensive Survey on Transfer Learning
Arxiv
121+阅读 · 2019年11月7日
Arxiv
15+阅读 · 2019年6月25日
Deep Learning for Energy Markets
Arxiv
10+阅读 · 2019年4月10日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
73+阅读 · 2018年12月22日
Deep Learning for Generic Object Detection: A Survey
Arxiv
13+阅读 · 2018年9月6日
Arxiv
22+阅读 · 2018年8月30日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
微信扫码咨询专知VIP会员