【香港浸会大学】有效通信的分布式深度学习:一个全面的综述

题目：

Communication-Efficient Distributed Deep Learning: A Comprehensive Survey

简介：

随着深度模型和数据集规模的增加，通过利用多个计算设备（例如GPU / TPU）来减少总体训练时间，分布式深度学习变得非常普遍。但是，计算设备之间的数据通信可能是限制系统可伸缩性的潜在瓶颈。近年来，如何解决分布式深度学习中的交流问题成为研究的热点。在本文中，我们对系统级和算法级优化中的通信有效的分布式训练算法进行了全面的概述。在系统级，我们对系统的设计和实现进行神秘化处理以降低通信成本。在算法级别，我们将不同的算法与理论收敛范围和通信复杂性进行比较。具体来说，我们首先提出数据并行分布式训练算法的分类法，它包含四个主要方面：通信同步，系统架构，压缩技术以及通信和计算的并行性。然后，我们讨论解决四个维度问题的研究，以比较通信成本。我们进一步比较了不同算法的收敛速度，这使我们能够知道算法在迭代方面可以收敛到解决方案的速度。根据系统级通信成本分析和理论收敛速度的比较，我们为读者提供了在特定的分布式环境下哪种算法更有效的方法，并推断出可能的方向以进行进一步的优化。

成为VIP会员查看完整内容

相关内容

香港浸会大学

关注 1

香港浸会大学（Hong Kong Baptist University），是一所国际化研究型博雅大学，为香港教资委资助的八所公立大学之一。浸大在 2021QS 世界年轻大学排名中位列全球第 23 名。浸大于 2022QS 世界大学排名中位列全球第 287 名。截至 2021 年，浸大在数据库领域位列世界第 13 位，在人工智能领域排名香港首位，世界第 37 位。计算机科学领域排名世界第 101-125 位，研究成果排名全港首位。

元学习(meta learning) 最新进展综述论文

专知会员服务

281+阅读 · 2020年5月8日

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

专知会员服务

126+阅读 · 2020年5月6日

【WF-IoT-普渡大学】低功耗深度学习和计算机视觉方法综述

专知会员服务

46+阅读 · 2020年3月26日

【中国人民大学】机器学习的隐私保护研究综述

专知会员服务

133+阅读 · 2020年3月25日