【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究 - 专知VIP

会员服务 ·

26

博士论文 · 加州大学伯克利分校 (UC Berkeley) · 分布式机器学习 ·

2022 年 5 月 17 日

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度神经网络(DNNs)使计算机能够在许多不同的应用中脱颖而出，如图像分类、语音识别和机器人控制。为了加快DNN的训练和服务，并行计算被广泛采用。向外扩展时，系统效率是一个大问题。在分布式机器学习中，高通信开销和有限的设备上内存是导致系统效率低下的两个主要原因。

https://www2.eecs.berkeley.edu/Pubs/TechRpts/2022/EECS-2022-83.html

本文研究了在分布式机器学习工作负载下，在数据和模型并行性方面减轻通信瓶颈并实现更好的设备上内存利用的可能方法。

在通信方面，我们的Blink项目缓解了数据并行训练中的通信瓶颈。通过打包生成树而不是形成环，Blink可以在任意网络环境中实现更高的灵活性，并提供近乎最佳的网络吞吐量。为了消除模型并行训练和推理过程中的通信问题，我们从系统层上升到应用层。我们的sensAI项目将多任务模型解耦到断开的子网中，其中每个子网负责单个任务或原始任务集的子集的决策制定。

为了更好地利用设备上的内存，我们的小波项目有意增加任务启动延迟，在加速器上的不同训练任务波之间交错使用内存峰值。通过将多个训练波集中在同一个加速器上，它提高了计算和设备上的内存利用率。

成为VIP会员查看完整内容

49

相关内容

博士论文

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【伯克利Guanhua Wang】分布式机器学习系统的颠覆性研究，附210页Slides与博士论文

【伯克利Guanhua Wang】分布式机器学习系统的颠覆性研究，附210页Slides与博士论文

专知会员服务

43+阅读 · 2022年7月6日

【2022新书】分布式机器学习Python实战，284页pdf

【2022新书】分布式机器学习Python实战，284页pdf

专知会员服务

138+阅读 · 2022年6月11日

【博士论文】分形计算系统

【博士论文】分形计算系统

专知会员服务

36+阅读 · 2021年12月9日

【斯坦福MLSys报告】分布式机器学习系统与联邦学习，附ppt与视频

专知会员服务

59+阅读 · 2021年8月28日

【伯利克博士论文】深度学习应用的算法、硬件和调度的协同设计，161页pdf

【伯利克博士论文】深度学习应用的算法、硬件和调度的协同设计，161页pdf

专知会员服务

75+阅读 · 2021年8月18日

【博士论文】大规模数据中心带宽分配与流量调度技术研究

【博士论文】大规模数据中心带宽分配与流量调度技术研究

专知会员服务

33+阅读 · 2020年12月15日

【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf

【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf

专知会员服务

54+阅读 · 2020年8月4日

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

专知会员服务

126+阅读 · 2020年5月6日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知会员服务

120+阅读 · 2019年12月26日

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

专知会员服务

43+阅读 · 2019年8月16日

【2022新书】分布式机器学习Python实战，284页pdf

【2022新书】分布式机器学习Python实战，284页pdf

专知

14+阅读 · 2022年6月11日

谷歌分布式机器学习优化实践

谷歌分布式机器学习优化实践

专知

2+阅读 · 2022年3月26日

纯Python实现Torch API，康奈尔副教授为自己的课程创建了DIY教学库

纯Python实现Torch API，康奈尔副教授为自己的课程创建了DIY教学库

机器之心

0+阅读 · 2021年12月12日

【博士论文】分形计算系统

【博士论文】分形计算系统

专知

3+阅读 · 2021年12月9日

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

专知

1+阅读 · 2021年12月5日

【博士论文】持久性内存存储系统关键技术研究

【博士论文】持久性内存存储系统关键技术研究

专知

2+阅读 · 2021年11月24日

联邦学习最新研究趋势！

联邦学习最新研究趋势！

AI科技评论

52+阅读 · 2020年3月12日

蚂蚁金服人工智能部论文《AGL:可扩展工业图机器学习系统》，处理十亿节点千亿边图数据的GNNs训练推理

蚂蚁金服人工智能部论文《AGL:可扩展工业图机器学习系统》，处理十亿节点千亿边图数据的GNNs训练推理

专知

33+阅读 · 2020年3月9日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

专知

27+阅读 · 2019年9月15日

随机接入中的分布式功率控制和数据包编码传输

国家自然科学基金

0+阅读 · 2015年12月31日

基于数据共享的高并发图计算系统及核心技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

粒子物理离线数据处理资源分配与作业管理双层调度算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

异构无线网络中的能效改善机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

多小区协作MIMO通信系统的有限反馈技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向稀疏矩阵和图计算的自适应优化方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向海量数据的基于效用的个性化学术资源推荐系统关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于博弈激励的分布式自适应异构无线网络拓扑控制

国家自然科学基金

0+阅读 · 2012年12月31日

AST3实时数据处理关键技术与系统

国家自然科学基金

0+阅读 · 2009年12月31日

异构的P2P覆盖网环境中容错的视频编码及传输

国家自然科学基金

0+阅读 · 2009年12月31日

Fine-Grained Modeling and Optimization for Intelligent Resource Management in Big Data Processing

Arxiv

0+阅读 · 2022年7月5日

Variational Inference of Dynamic Factor Models with Arbitrary Missing Data

Arxiv

0+阅读 · 2022年7月5日

Discriminator-Guided Model-Based Offline Imitation Learning

Arxiv

0+阅读 · 2022年7月5日

Oakestra white paper: An Orchestrator for Edge Computing

Arxiv

0+阅读 · 2022年7月4日

Brief Industry Paper: The Necessity of Adaptive Data Fusion in Infrastructure-Augmented Autonomous Driving System

Arxiv

0+阅读 · 2022年7月2日

A Human-Centric Assessment Framework for AI

A Human-Centric Assessment Framework for AI

Arxiv

0+阅读 · 2022年7月1日

Sustainable Computing -- Without the Hot Air

Arxiv

0+阅读 · 2022年6月30日

Heterogeneous Noisy Short Signal Camouflage in Multi-Domain Environment Decision-Making

Arxiv

34+阅读 · 2021年6月2日

Heterogeneous Network Representation Learning: A Unified Framework with Survey and Benchmark

Heterogeneous Network Representation Learning: A Unified Framework with Survey and Benchmark

Arxiv

19+阅读 · 2020年12月17日

Recent Advances and Challenges in Task-oriented Dialog System

Recent Advances and Challenges in Task-oriented Dialog System

Arxiv

18+阅读 · 2020年3月19日

VIP会员

相关主题

加州大学伯克利分校 (UC Berkeley)

分布式机器学习

相关VIP内容

【伯克利Guanhua Wang】分布式机器学习系统的颠覆性研究，附210页Slides与博士论文

【伯克利Guanhua Wang】分布式机器学习系统的颠覆性研究，附210页Slides与博士论文

专知会员服务

43+阅读 · 2022年7月6日

【2022新书】分布式机器学习Python实战，284页pdf

【2022新书】分布式机器学习Python实战，284页pdf

专知会员服务

138+阅读 · 2022年6月11日

【博士论文】分形计算系统

【博士论文】分形计算系统

专知会员服务

36+阅读 · 2021年12月9日

【斯坦福MLSys报告】分布式机器学习系统与联邦学习，附ppt与视频

专知会员服务

59+阅读 · 2021年8月28日

【伯利克博士论文】深度学习应用的算法、硬件和调度的协同设计，161页pdf

【伯利克博士论文】深度学习应用的算法、硬件和调度的协同设计，161页pdf

专知会员服务

75+阅读 · 2021年8月18日

【博士论文】大规模数据中心带宽分配与流量调度技术研究

【博士论文】大规模数据中心带宽分配与流量调度技术研究

专知会员服务

33+阅读 · 2020年12月15日

【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf

【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf

专知会员服务

54+阅读 · 2020年8月4日

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

专知会员服务

126+阅读 · 2020年5月6日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知会员服务

120+阅读 · 2019年12月26日

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

专知会员服务

43+阅读 · 2019年8月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《生成式人工智能与大/小语言模型在供应链管理决策优化与可持续性提升中的作用评估》最新51页

白宫发布《赢得AI竞赛：美国人工智能行动计划》最新28页

地下战：地下空间的战略博弈

《美地下作战条令手册》228页

相关资讯

【2022新书】分布式机器学习Python实战，284页pdf

【2022新书】分布式机器学习Python实战，284页pdf

专知

14+阅读 · 2022年6月11日

谷歌分布式机器学习优化实践

谷歌分布式机器学习优化实践

专知

2+阅读 · 2022年3月26日

纯Python实现Torch API，康奈尔副教授为自己的课程创建了DIY教学库

纯Python实现Torch API，康奈尔副教授为自己的课程创建了DIY教学库

机器之心

0+阅读 · 2021年12月12日

【博士论文】分形计算系统

【博士论文】分形计算系统

专知

3+阅读 · 2021年12月9日

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

专知

1+阅读 · 2021年12月5日

【博士论文】持久性内存存储系统关键技术研究

【博士论文】持久性内存存储系统关键技术研究

专知

2+阅读 · 2021年11月24日

联邦学习最新研究趋势！

联邦学习最新研究趋势！

AI科技评论

52+阅读 · 2020年3月12日

蚂蚁金服人工智能部论文《AGL:可扩展工业图机器学习系统》，处理十亿节点千亿边图数据的GNNs训练推理

蚂蚁金服人工智能部论文《AGL:可扩展工业图机器学习系统》，处理十亿节点千亿边图数据的GNNs训练推理

专知

33+阅读 · 2020年3月9日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

专知

27+阅读 · 2019年9月15日

相关基金

随机接入中的分布式功率控制和数据包编码传输

国家自然科学基金

0+阅读 · 2015年12月31日

基于数据共享的高并发图计算系统及核心技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

粒子物理离线数据处理资源分配与作业管理双层调度算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

异构无线网络中的能效改善机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

多小区协作MIMO通信系统的有限反馈技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向稀疏矩阵和图计算的自适应优化方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向海量数据的基于效用的个性化学术资源推荐系统关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于博弈激励的分布式自适应异构无线网络拓扑控制

国家自然科学基金

0+阅读 · 2012年12月31日

AST3实时数据处理关键技术与系统

国家自然科学基金

0+阅读 · 2009年12月31日

异构的P2P覆盖网环境中容错的视频编码及传输

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Fine-Grained Modeling and Optimization for Intelligent Resource Management in Big Data Processing

Arxiv

0+阅读 · 2022年7月5日

Variational Inference of Dynamic Factor Models with Arbitrary Missing Data

Arxiv

0+阅读 · 2022年7月5日

Discriminator-Guided Model-Based Offline Imitation Learning

Arxiv

0+阅读 · 2022年7月5日

Oakestra white paper: An Orchestrator for Edge Computing

Arxiv

0+阅读 · 2022年7月4日

Brief Industry Paper: The Necessity of Adaptive Data Fusion in Infrastructure-Augmented Autonomous Driving System

Arxiv

0+阅读 · 2022年7月2日

A Human-Centric Assessment Framework for AI

A Human-Centric Assessment Framework for AI

Arxiv

0+阅读 · 2022年7月1日

Sustainable Computing -- Without the Hot Air

Arxiv

0+阅读 · 2022年6月30日

Heterogeneous Noisy Short Signal Camouflage in Multi-Domain Environment Decision-Making

Arxiv

34+阅读 · 2021年6月2日

Heterogeneous Network Representation Learning: A Unified Framework with Survey and Benchmark

Heterogeneous Network Representation Learning: A Unified Framework with Survey and Benchmark

Arxiv

19+阅读 · 2020年12月17日

Recent Advances and Challenges in Task-oriented Dialog System

Recent Advances and Challenges in Task-oriented Dialog System

Arxiv

18+阅读 · 2020年3月19日

微信扫码咨询专知VIP会员