【伯克利Guanhua Wang】分布式机器学习系统的颠覆性研究，附210页Slides与博士论文 - 专知VIP

会员服务 ·

26

分布式机器学习 · 加州大学伯克利分校 (UC Berkeley) · 深度学习 ·

2022 年 7 月 6 日

【伯克利Guanhua Wang】分布式机器学习系统的颠覆性研究，附210页Slides与博士论文

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度神经网络(DNNs)使计算机能够在许多不同的应用中脱颖而出，如图像分类、语音识别和机器人控制。为了加快DNN的训练和服务，并行计算被广泛采用。向外扩展时，系统效率是一个大问题。在这次演讲中，我将对分布式DNN训练和服务中更好的系统效率提出三个论点。

首先，对于模型同步，Ring All-Reduce不是最优的，但Blink是。通过打包生成树而不是形成环，Blink可以在任意网络环境中实现更高的灵活性，并提供近乎最优的网络吞吐量。Blink是一项美国专利，目前正在被微软使用。Blink获得了许多业内人士的关注，比如Facebook(分布式PyTorch团队)、字节跳动(TikTok应用的母公司)。Blink还登上了英伟达GTC中国2019以及百度、腾讯等的新闻。

其次，通过sensAI的类并行性可以消除通信。sensAI将多任务模型解耦到断开的子网中，每个子网负责单个任务的决策。sensAI的低延迟、实时模式服务吸引了湾区的几家风险投资公司。

第三，小波变换比分组调度更有效。通过有意地增加任务启动延迟，小波变换在加速器上不同训练波的内存使用峰值之间交错，从而提高了计算和设备上的内存使用。

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

成为VIP会员查看完整内容

44

相关内容

分布式机器学习

分布式机器学习

分布式机器学习研究将具有大规模数据量和计算量的任务分布式地部署到多台机器上,其核心思想在于“分而治之”,有效提高了大规模数据计算的速度并节省了开销。

ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频

ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频

专知会员服务

85+阅读 · 2022年7月18日

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

专知会员服务

49+阅读 · 2022年5月17日

开课了！CMU《多模态机器学习》2022课程，附课件与视频

开课了！CMU《多模态机器学习》2022课程，附课件与视频

专知会员服务

155+阅读 · 2022年2月1日

【博士论文】集群系统中的网络流调度

【博士论文】集群系统中的网络流调度

专知会员服务

46+阅读 · 2021年12月7日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【斯坦福MLSys报告】分布式机器学习系统与联邦学习，附ppt与视频

专知会员服务

60+阅读 · 2021年8月28日

【CMU博士论文】可控文本生成，附107页pdf与Slides

【CMU博士论文】可控文本生成，附107页pdf与Slides

专知会员服务

57+阅读 · 2021年4月21日

【斯坦福大学】矩阵对策的协调方法，89页pdf

【斯坦福大学】矩阵对策的协调方法，89页pdf

专知会员服务

27+阅读 · 2020年9月18日

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

专知会员服务

162+阅读 · 2020年6月14日

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

专知会员服务

58+阅读 · 2020年5月4日

ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频

ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频

专知

0+阅读 · 2022年7月18日

量子人工智能：机遇与挑战 | 7月5日TF64

量子人工智能：机遇与挑战 | 7月5日TF64

量子位

0+阅读 · 2022年7月3日

69页Slides与视频！《网络联邦学习》教程，阿尔托大学Alexander Jung博士讲述大数据网络中如何用联邦学习

69页Slides与视频！《网络联邦学习》教程，阿尔托大学Alexander Jung博士讲述大数据网络中如何用联邦学习

专知

2+阅读 · 2022年6月5日

AAAI/ACM SIGAI博士论文奖《大型对抗性不完美信息博弈的均衡发现》附230页pdf与slides

AAAI/ACM SIGAI博士论文奖《大型对抗性不完美信息博弈的均衡发现》附230页pdf与slides

专知

5+阅读 · 2022年3月1日

CMU德扑AI真是大奖拿到手软，Noam Brown获AAAI/ACM SIGAI博士论文奖

CMU德扑AI真是大奖拿到手软，Noam Brown获AAAI/ACM SIGAI博士论文奖

机器之心

0+阅读 · 2022年2月28日

开课了！CMU《多模态机器学习》2022课程，附课件

开课了！CMU《多模态机器学习》2022课程，附课件

专知

8+阅读 · 2022年2月1日

【博士论文】集群系统中的网络流调度

【博士论文】集群系统中的网络流调度

专知

5+阅读 · 2021年12月7日

【博士论文】持久性内存存储系统关键技术研究

【博士论文】持久性内存存储系统关键技术研究

专知

2+阅读 · 2021年11月24日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

干货：手把手教你在音频分类DCASE2017比赛中夺冠

干货：手把手教你在音频分类DCASE2017比赛中夺冠

全球人工智能

15+阅读 · 2017年9月22日

基于张量模式的DTI数据模式分类及其分布式算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

介孔复合微纳结构CaTi2O5的可控制备及光催化性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算的高稳定树推式应用层组播研究

国家自然科学基金

0+阅读 · 2014年12月31日

多微通道内存控制器关键技术的研究

国家自然科学基金

0+阅读 · 2013年12月31日

分布式计算智能理论及应用

国家自然科学基金

5+阅读 · 2013年12月31日

双原位细乳液法一步制备聚合物/SiO2纳米复合材料以及杂化粒子的形成机理研究

国家自然科学基金

0+阅读 · 2011年12月31日

云计算任务调度机制中多目标有向超图优化划分问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

Janus纳米粒子在嵌段共聚物中的定向与协同自组装：有序超分子结构及其力学性能

国家自然科学基金

0+阅读 · 2011年12月31日

基于耦合矩阵特征值谱的网络拓扑结构与同步动力学关系研究

国家自然科学基金

0+阅读 · 2009年12月31日

用于光动力治疗和智能药物输运的纳米上转换荧光材料的构建和性能研究

国家自然科学基金

0+阅读 · 2009年12月31日

A Multi-Modality Ovarian Tumor Ultrasound Image Dataset for Unsupervised Cross-Domain Semantic Segmentation

Arxiv

0+阅读 · 2022年8月26日

Leveraging Symmetrical Convolutional Transformer Networks for Speech to Singing Voice Style Transfer

Arxiv

0+阅读 · 2022年8月26日

An adaptive kernel estimator for the intensity function of spatio-temporal point processes

Arxiv

0+阅读 · 2022年8月25日

Adversarial Driving: Attacking End-to-End Autonomous Driving

Adversarial Driving: Attacking End-to-End Autonomous Driving

Arxiv

0+阅读 · 2022年8月24日

Active Gaze Control for Foveal Scene Exploration

Active Gaze Control for Foveal Scene Exploration

Arxiv

0+阅读 · 2022年8月24日

Synergy: Resource Sensitive DNN Scheduling in Multi-Tenant Clusters

Arxiv

0+阅读 · 2022年8月24日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Graph Neural Networks for Social Recommendation

Arxiv

20+阅读 · 2019年11月23日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

An application of cascaded 3D fully convolutional networks for medical image segmentation

Arxiv

10+阅读 · 2018年3月20日

VIP会员

相关主题

分布式机器学习

加州大学伯克利分校 (UC Berkeley)

相关VIP内容

ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频

ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频

专知会员服务

85+阅读 · 2022年7月18日

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

专知会员服务

49+阅读 · 2022年5月17日

开课了！CMU《多模态机器学习》2022课程，附课件与视频

开课了！CMU《多模态机器学习》2022课程，附课件与视频

专知会员服务

155+阅读 · 2022年2月1日

【博士论文】集群系统中的网络流调度

【博士论文】集群系统中的网络流调度

专知会员服务

46+阅读 · 2021年12月7日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【斯坦福MLSys报告】分布式机器学习系统与联邦学习，附ppt与视频

专知会员服务

60+阅读 · 2021年8月28日

【CMU博士论文】可控文本生成，附107页pdf与Slides

【CMU博士论文】可控文本生成，附107页pdf与Slides

专知会员服务

57+阅读 · 2021年4月21日

【斯坦福大学】矩阵对策的协调方法，89页pdf

【斯坦福大学】矩阵对策的协调方法，89页pdf

专知会员服务

27+阅读 · 2020年9月18日

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

专知会员服务

162+阅读 · 2020年6月14日

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

专知会员服务

58+阅读 · 2020年5月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《解析陆域作战方向：一个概念性框架》报告

《人工智能与人类的未来》2025年最新300页书籍

追寻真正的AI自主性：从遗留思维到战场优势

《“蛛网”行动：乌克兰不对称作战的演进》报告

相关资讯

ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频

ICML2022开会了！如炼何大模型？伯克利最新《大模型训练和服务的技术和系统》教程，176页ppt阐述大模型关键技术，附视频

专知

0+阅读 · 2022年7月18日

量子人工智能：机遇与挑战 | 7月5日TF64

量子人工智能：机遇与挑战 | 7月5日TF64

量子位

0+阅读 · 2022年7月3日

69页Slides与视频！《网络联邦学习》教程，阿尔托大学Alexander Jung博士讲述大数据网络中如何用联邦学习

69页Slides与视频！《网络联邦学习》教程，阿尔托大学Alexander Jung博士讲述大数据网络中如何用联邦学习

专知

2+阅读 · 2022年6月5日

AAAI/ACM SIGAI博士论文奖《大型对抗性不完美信息博弈的均衡发现》附230页pdf与slides

AAAI/ACM SIGAI博士论文奖《大型对抗性不完美信息博弈的均衡发现》附230页pdf与slides

专知

5+阅读 · 2022年3月1日

CMU德扑AI真是大奖拿到手软，Noam Brown获AAAI/ACM SIGAI博士论文奖

CMU德扑AI真是大奖拿到手软，Noam Brown获AAAI/ACM SIGAI博士论文奖

机器之心

0+阅读 · 2022年2月28日

开课了！CMU《多模态机器学习》2022课程，附课件

开课了！CMU《多模态机器学习》2022课程，附课件

专知

8+阅读 · 2022年2月1日

【博士论文】集群系统中的网络流调度

【博士论文】集群系统中的网络流调度

专知

5+阅读 · 2021年12月7日

【博士论文】持久性内存存储系统关键技术研究

【博士论文】持久性内存存储系统关键技术研究

专知

2+阅读 · 2021年11月24日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

干货：手把手教你在音频分类DCASE2017比赛中夺冠

干货：手把手教你在音频分类DCASE2017比赛中夺冠

全球人工智能

15+阅读 · 2017年9月22日

相关基金

基于张量模式的DTI数据模式分类及其分布式算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

介孔复合微纳结构CaTi2O5的可控制备及光催化性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算的高稳定树推式应用层组播研究

国家自然科学基金

0+阅读 · 2014年12月31日

多微通道内存控制器关键技术的研究

国家自然科学基金

0+阅读 · 2013年12月31日

分布式计算智能理论及应用

国家自然科学基金

5+阅读 · 2013年12月31日

双原位细乳液法一步制备聚合物/SiO2纳米复合材料以及杂化粒子的形成机理研究

国家自然科学基金

0+阅读 · 2011年12月31日

云计算任务调度机制中多目标有向超图优化划分问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

Janus纳米粒子在嵌段共聚物中的定向与协同自组装：有序超分子结构及其力学性能

国家自然科学基金

0+阅读 · 2011年12月31日

基于耦合矩阵特征值谱的网络拓扑结构与同步动力学关系研究

国家自然科学基金

0+阅读 · 2009年12月31日

用于光动力治疗和智能药物输运的纳米上转换荧光材料的构建和性能研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

A Multi-Modality Ovarian Tumor Ultrasound Image Dataset for Unsupervised Cross-Domain Semantic Segmentation

Arxiv

0+阅读 · 2022年8月26日

Leveraging Symmetrical Convolutional Transformer Networks for Speech to Singing Voice Style Transfer

Arxiv

0+阅读 · 2022年8月26日

An adaptive kernel estimator for the intensity function of spatio-temporal point processes

Arxiv

0+阅读 · 2022年8月25日

Adversarial Driving: Attacking End-to-End Autonomous Driving

Adversarial Driving: Attacking End-to-End Autonomous Driving

Arxiv

0+阅读 · 2022年8月24日

Active Gaze Control for Foveal Scene Exploration

Active Gaze Control for Foveal Scene Exploration

Arxiv

0+阅读 · 2022年8月24日

Synergy: Resource Sensitive DNN Scheduling in Multi-Tenant Clusters

Arxiv

0+阅读 · 2022年8月24日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Graph Neural Networks for Social Recommendation

Arxiv

20+阅读 · 2019年11月23日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

An application of cascaded 3D fully convolutional networks for medical image segmentation

Arxiv

10+阅读 · 2018年3月20日

微信扫码咨询专知VIP会员