【CMU-zhanghao博士论文】机器学习并行化：自适应、可组合与自动化，附229页pdf与答辩视频 - 专知

会员服务 ·

0

【CMU-zhanghao博士论文】机器学习并行化：自适应、可组合与自动化，附229页pdf与答辩视频

2020 年 10 月 18 日 专知

来自卡内基梅隆大学机器人研究所Zhanghao博士论文，他师从著名的邢波教授！博士题目是机器学习并行可以是自适应的、可组合的和自动化的，不可错过！

Zhang hao，卡内基梅隆大学机器人研究所博士，导师是Eric Xing教授。毕业后将加入加州大学伯克利分校的RISE实验室，做博士后。

https://www.cs.cmu.edu/~hzhang2/

Machine Learning Parallelism Could Be Adaptive, Composable and Automated

答辩视频

近年来，机器学习(ML)领域的创新步伐加快，SysML的研究人员已经创建了在多个设备或计算节点上并行化ML训练的算法和系统。随着ML模型在结构上变得越来越复杂，许多系统都努力在各种模型上提供全面的性能。一般来说，根据从适当的分布策略映射到模型所需的知识数量和时间，ML的规模通常被低估了。将并行训练系统应用到复杂的模型中，除了模型原型之外，还增加了重要的开发开销，并且经常导致低于预期的性能。本文识别并解决并行ML技术和系统实现在可用性和性能方面的研究挑战。

本文的第一部分提出了一个简单的设计原则，自适应并行化，它根据特定的ML属性将适当的并行化技术应用于模型构建块(如层)。接下来，我们导出了一系列优化ML并行化不同方面的优化和实现。我们对它们进行了研究，并表明它们显著提高了ML训练在适用场景下对集群进行2-10倍的效率或可伸缩性。

为了推广这种方法，本论文的第二部分将ML并行化为端到端优化问题，并寻求自动解决它，用于ML并行任务的两种广泛范例:单节点动态批处理和分布式ML并行。我们提出了有原则的表示来表示两类ML并行性，以及可组合的系统架构，分别是Cavs和AutoDist。它们支持为不可见的模型快速组合并行化策略，提高并行化性能，并简化并行ML编程。

在此基础上，本文的第三部分提出了自动并行化框架AutoSync，用于自动优化数据并行分布训练中的同步策略。AutoSync实现了“开框即用”的高性能——它在提议的表现方式所覆盖的范围内导航，并自动识别同步策略，这些同步策略的速度比现有手动优化的系统快1.2 - 1.6倍，降低了分布式ML的技术障碍，并帮助更大的用户社区访问它。本文所开发的技术和系统为分布式环境下大规模ML训练的端到端编译器系统的概念和原型实现提供了理论依据。

论文结构：

第一部分(第三章-第五章):通过自适应并行来理解和优化并行ML在各个方面的性能;
第二部分(第六章-第七章):开发ML并行的统一表示和可组合系统;
第三部分(第八章):自动化ML并行化

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“PML229” 可以获取《【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

可组合

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

专知会员服务

50+阅读 · 2020年10月18日

【Aalto博士论文】高效样本近似贝叶斯计算的高斯过程代理方法，84页pdf

专知会员服务

35+阅读 · 2020年9月30日

【德国杜宾根大学博士论文】深度生成模型的稳定性与表达力，279页pdf

【德国杜宾根大学博士论文】深度生成模型的稳定性与表达力，279页pdf

专知会员服务

46+阅读 · 2020年9月9日

【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf

【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf

专知会员服务

54+阅读 · 2020年8月4日

耶鲁大学《分布式系统理论》笔记，491页pdf

耶鲁大学《分布式系统理论》笔记，491页pdf

专知会员服务

46+阅读 · 2020年7月29日

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

专知会员服务

95+阅读 · 2020年6月19日

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

专知会员服务

162+阅读 · 2020年6月14日

【开放书】《自动化机器学习：方法，系统与挑战》，附223页pdf下载

【开放书】《自动化机器学习：方法，系统与挑战》，附223页pdf下载

专知会员服务

160+阅读 · 2019年12月18日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

天津大学最新「边缘计算与深度学习的融合」综述论文，35页pdf

天津大学最新「边缘计算与深度学习的融合」综述论文，35页pdf

专知

8+阅读 · 2020年1月7日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

ICLR 2019论文解读：量化神经网络

ICLR 2019论文解读：量化神经网络

机器之心

9+阅读 · 2019年6月13日

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

专知

30+阅读 · 2019年1月2日

斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能,195页PDF

斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能,195页PDF

专知

57+阅读 · 2018年12月16日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知

62+阅读 · 2018年12月15日

孟小峰：机器学习与数据库技术融合

孟小峰：机器学习与数据库技术融合

计算机研究与发展

14+阅读 · 2018年9月6日

斯坦福大学Fall 2018课程-机器学习硬件加速器( 附PPT下载)

斯坦福大学Fall 2018课程-机器学习硬件加速器( 附PPT下载)

专知

18+阅读 · 2018年7月15日

[论文笔记] GAN开山之作及最新综述

[论文笔记] GAN开山之作及最新综述

专知

12+阅读 · 2017年12月19日

Privacy Labelling and the Story of Princess Privacy and the Seven Helpers

Arxiv

0+阅读 · 2020年12月3日

Distributed Reinforcement Learning is a Dataflow Problem

Arxiv

0+阅读 · 2020年12月3日

Opytimizer: A Nature-Inspired Python Optimizer

Arxiv

0+阅读 · 2020年12月2日

Age of Information in a Decentralized Network of Parallel Queues with Routing and Packets Losses

Arxiv

0+阅读 · 2020年12月1日

Accelerating MCMC algorithms through Bayesian Deep Networks

Arxiv

0+阅读 · 2020年11月29日

A theory of transaction parallelism in blockchains

Arxiv

0+阅读 · 2020年11月27日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

A generic framework for privacy preserving deep learning

Arxiv

6+阅读 · 2018年11月13日

Language GANs Falling Short

Arxiv

7+阅读 · 2018年11月6日

Coulomb GANs: Provably Optimal Nash Equilibria via Potential Fields

Arxiv

4+阅读 · 2018年1月30日

VIP会员

相关主题

卡内基梅隆大学机器人研究所

相关VIP内容

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

专知会员服务

50+阅读 · 2020年10月18日

【Aalto博士论文】高效样本近似贝叶斯计算的高斯过程代理方法，84页pdf

专知会员服务

35+阅读 · 2020年9月30日

【德国杜宾根大学博士论文】深度生成模型的稳定性与表达力，279页pdf

【德国杜宾根大学博士论文】深度生成模型的稳定性与表达力，279页pdf

专知会员服务

46+阅读 · 2020年9月9日

【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf

【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf

专知会员服务

54+阅读 · 2020年8月4日

耶鲁大学《分布式系统理论》笔记，491页pdf

耶鲁大学《分布式系统理论》笔记，491页pdf

专知会员服务

46+阅读 · 2020年7月29日

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

专知会员服务

95+阅读 · 2020年6月19日

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

专知会员服务

162+阅读 · 2020年6月14日

【开放书】《自动化机器学习：方法，系统与挑战》，附223页pdf下载

【开放书】《自动化机器学习：方法，系统与挑战》，附223页pdf下载

专知会员服务

160+阅读 · 2019年12月18日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

面向具身智能的多模态数据存储与检索：综述

《算法战争研究计划全景评估》35页

【CMU博士论文】水下三维视觉感知与生成

智能体战争：自主人工智能军备竞赛全景透视

相关资讯

天津大学最新「边缘计算与深度学习的融合」综述论文，35页pdf

天津大学最新「边缘计算与深度学习的融合」综述论文，35页pdf

专知

8+阅读 · 2020年1月7日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

ICLR 2019论文解读：量化神经网络

ICLR 2019论文解读：量化神经网络

机器之心

9+阅读 · 2019年6月13日

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

专知

30+阅读 · 2019年1月2日

斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能,195页PDF

斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能,195页PDF

专知

57+阅读 · 2018年12月16日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知

62+阅读 · 2018年12月15日

孟小峰：机器学习与数据库技术融合

孟小峰：机器学习与数据库技术融合

计算机研究与发展

14+阅读 · 2018年9月6日

斯坦福大学Fall 2018课程-机器学习硬件加速器( 附PPT下载)

斯坦福大学Fall 2018课程-机器学习硬件加速器( 附PPT下载)

专知

18+阅读 · 2018年7月15日

[论文笔记] GAN开山之作及最新综述

[论文笔记] GAN开山之作及最新综述

专知

12+阅读 · 2017年12月19日

相关论文

Privacy Labelling and the Story of Princess Privacy and the Seven Helpers

Arxiv

0+阅读 · 2020年12月3日

Distributed Reinforcement Learning is a Dataflow Problem

Arxiv

0+阅读 · 2020年12月3日

Opytimizer: A Nature-Inspired Python Optimizer

Arxiv

0+阅读 · 2020年12月2日

Age of Information in a Decentralized Network of Parallel Queues with Routing and Packets Losses

Arxiv

0+阅读 · 2020年12月1日

Accelerating MCMC algorithms through Bayesian Deep Networks

Arxiv

0+阅读 · 2020年11月29日

A theory of transaction parallelism in blockchains

Arxiv

0+阅读 · 2020年11月27日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

A generic framework for privacy preserving deep learning

Arxiv

6+阅读 · 2018年11月13日

Language GANs Falling Short

Arxiv

7+阅读 · 2018年11月6日

Coulomb GANs: Provably Optimal Nash Equilibria via Potential Fields

Arxiv

4+阅读 · 2018年1月30日

大家都在搜

国防科技创新

CMU博士论文

无人机集群

软件无线电

再见，TD-SCDMA！

微信扫码咨询专知VIP会员