【干货书】深度学习系统: 大规模生产的算法、编译器和处理器，267页pdf - 专知VIP

会员服务 ·

49

深度学习 · 深度学习系统 · 算法 · 编译器 ·

2022 年 6 月 1 日

【干货书】深度学习系统: 大规模生产的算法、编译器和处理器，267页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

这本书描述了深度学习系统: 算法，编译器和处理器组件，以有效地训练和部署深度学习模型的商业应用。

当最先进的深度学习(DL)工作负载消耗的计算量快速增长时，计算能力的指数增长正在放缓。模型大小、服务延迟和功率限制是在许多应用程序中部署DL模型的一个重大挑战。因此，协同设计算法、编译器和硬件势在必行，以提高性能、功率和效率的整体系统级和算法解决方案来加速这一领域的发展。

推进深度学习系统的工程师通常包括三类:(1)数据科学家，他们与领域专家(如医学、经济或气候科学家)合作，利用和开发深度学习算法;(2)硬件设计师开发专门的硬件来加速DL模型中的组件;(3)性能和编译工程师优化软件，使其在给定的硬件上更有效地运行。硬件工程师应该了解产品和学术模型的特性和组成部分，这些特性和组成部分很可能被业界采用，以指导影响未来硬件的设计决策。数据科学家在设计模型时应该注意部署平台的限制。性能工程师应该支持跨不同模型、库和硬件目标的优化。

本书的目的是提供扎实的理解 (1)工业DL算法的设计、训练和应用; (2) 将深度学习代码映射到硬件目标的编译技术; (3) 加速DL系统的关键硬件特性。本书旨在促进DL系统的发展的共同创新。它是为在一个或多个领域工作的工程师编写的，他们试图了解整个系统堆栈，以便更好地与在系统堆栈其他部分工作的工程师协作。

这本书详细介绍了工业中DL模型的进步和采用，解释了训练和部署过程，描述了今天和未来模型所需的基本硬件架构特征，并详细介绍了DL编译器的进步，以有效地执行各种硬件目标的算法。

本书的独特之处在于对整个DL系统堆栈的全面阐述，对商业应用的强调，以及设计模型和加速其性能的实用技术。作者有幸与许多拥有超大规模数据中心的高科技公司的硬件、软件、数据科学家和研究团队一起工作。这些公司采用了本书中提供的许多例子和方法。

成为VIP会员查看完整内容

91

相关内容

深度学习

机器学习的一个分支，它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

专知会员服务

61+阅读 · 2022年7月16日

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

专知会员服务

152+阅读 · 2022年7月15日

【2022新书】设计机器学习系统：生产部署应用的迭代过程，Chip Huyen编著

【2022新书】设计机器学习系统：生产部署应用的迭代过程，Chip Huyen编著

专知会员服务

100+阅读 · 2022年7月13日

【2022新书】分布式机器学习Python实战，284页pdf

【2022新书】分布式机器学习Python实战，284页pdf

专知会员服务

138+阅读 · 2022年6月11日

【2021新书】并行高性能计算，705页pdf，Parallel and High Performance Computing

【2021新书】并行高性能计算，705页pdf，Parallel and High Performance Computing

专知会员服务

105+阅读 · 2021年10月30日

【干货书】算法设计艺术，319页pdf

【干货书】算法设计艺术，319页pdf

专知会员服务

121+阅读 · 2021年10月24日

重磅！《图机器学习》MANNing新书，493页pdf阐述图机器学习工业实战技术：推荐对话、欺诈检测、NLP等应用

重磅！《图机器学习》MANNing新书，493页pdf阐述图机器学习工业实战技术：推荐对话、欺诈检测、NLP等应用

专知会员服务

209+阅读 · 2021年10月21日

【干货书】数值优化，683页pdf

专知会员服务

107+阅读 · 2021年8月23日

【2021新书】机器学习模型生产部署实践，161页pdf，

【2021新书】机器学习模型生产部署实践，161页pdf，

专知会员服务

113+阅读 · 2021年6月11日

【干货书】数值Python计算，Numerical Python，709页pdf

【干货书】数值Python计算，Numerical Python，709页pdf

专知会员服务

116+阅读 · 2021年5月30日

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

专知

4+阅读 · 2022年7月16日

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

专知

33+阅读 · 2022年7月15日

【2022新书】设计机器学习系统：生产部署应用的迭代过程，Chip Huyen编著

【2022新书】设计机器学习系统：生产部署应用的迭代过程，Chip Huyen编著

专知

6+阅读 · 2022年7月13日

【2022新书】分布式机器学习Python实战，284页pdf

【2022新书】分布式机器学习Python实战，284页pdf

专知

14+阅读 · 2022年6月11日

【Manning新书】大规模数据结构和算法，306页pdf

【Manning新书】大规模数据结构和算法，306页pdf

专知

13+阅读 · 2022年5月30日

PyTorch官方发布推荐系统仓库: TorchRec

PyTorch官方发布推荐系统仓库: TorchRec

机器学习与推荐算法

4+阅读 · 2022年3月16日

无处不在的 JavaScript

无处不在的 JavaScript

InfoQ

0+阅读 · 2022年3月15日

【干货书】如何编写出牛叉的代码来？Write Great Code第二卷，660页pdf

【干货书】如何编写出牛叉的代码来？Write Great Code第二卷，660页pdf

专知

2+阅读 · 2021年12月5日

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

专知

3+阅读 · 2021年10月24日

21新书《图机器学习GPML》493页pdf阐述图机器学习工业实战技术

21新书《图机器学习GPML》493页pdf阐述图机器学习工业实战技术

图与推荐

14+阅读 · 2021年10月22日

大型异构系统上数百万核可扩展的新型区域分裂隐式求解器研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向人脸检测的大规模异构并行Adaboost机器学习算法研究

国家自然科学基金

3+阅读 · 2013年12月31日

面向应用领域的处理器软硬件协同设计关键技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

大规模生物序列比对及其基于异构系统的并行处理技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于纠删码的大规模存储集群重构优化技术

国家自然科学基金

0+阅读 · 2013年12月31日

炼化系统大规模动态与多目标优化的GPU异构并行加速策略及方法

国家自然科学基金

2+阅读 · 2012年12月31日

针对视频分析的高能效异构硬件计算系统研究

国家自然科学基金

1+阅读 · 2012年12月31日

FPGA嵌入式抗辐照容错处理器核及其系统设计实现研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于编译的嵌入式系统优化研究

国家自然科学基金

1+阅读 · 2011年12月31日

众核处理器结构上的并行程序执行模型

国家自然科学基金

0+阅读 · 2009年12月31日

MobileCodec: Neural Inter-frame Video Compression on Mobile Devices

Arxiv

0+阅读 · 2022年7月18日

A Fast, Autonomous, Bipedal Walking Behavior over Rapid Regions

Arxiv

0+阅读 · 2022年7月17日

On the Practical Power of Automata in Pattern Matching

Arxiv

0+阅读 · 2022年7月17日

S4: a High-sparsity, High-performance AI Accelerator

Arxiv

0+阅读 · 2022年7月16日

Spatz: A Compact Vector Processing Unit for High-Performance and Energy-Efficient Shared-L1 Clusters

Arxiv

0+阅读 · 2022年7月16日

On Scheduling Ring-All-Reduce Learning Jobs in Multi-Tenant GPU Clusters with Communication Contention

Arxiv

0+阅读 · 2022年7月16日

Multi-Agent Simulation for AI Behaviour Discovery in Operations Research

Arxiv

39+阅读 · 2021年8月30日

Deep Learning on Image Denoising: An overview

Arxiv

13+阅读 · 2020年8月3日

已删除

Arxiv

32+阅读 · 2020年3月23日

Image Captioning using Deep Neural Architectures

Arxiv

20+阅读 · 2018年1月17日

VIP会员

相关主题

深度学习系统

相关VIP内容

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

专知会员服务

61+阅读 · 2022年7月16日

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

专知会员服务

152+阅读 · 2022年7月15日

【2022新书】设计机器学习系统：生产部署应用的迭代过程，Chip Huyen编著

【2022新书】设计机器学习系统：生产部署应用的迭代过程，Chip Huyen编著

专知会员服务

100+阅读 · 2022年7月13日

【2022新书】分布式机器学习Python实战，284页pdf

【2022新书】分布式机器学习Python实战，284页pdf

专知会员服务

138+阅读 · 2022年6月11日

【2021新书】并行高性能计算，705页pdf，Parallel and High Performance Computing

【2021新书】并行高性能计算，705页pdf，Parallel and High Performance Computing

专知会员服务

105+阅读 · 2021年10月30日

【干货书】算法设计艺术，319页pdf

【干货书】算法设计艺术，319页pdf

专知会员服务

121+阅读 · 2021年10月24日

重磅！《图机器学习》MANNing新书，493页pdf阐述图机器学习工业实战技术：推荐对话、欺诈检测、NLP等应用

重磅！《图机器学习》MANNing新书，493页pdf阐述图机器学习工业实战技术：推荐对话、欺诈检测、NLP等应用

专知会员服务

209+阅读 · 2021年10月21日

【干货书】数值优化，683页pdf

专知会员服务

107+阅读 · 2021年8月23日

【2021新书】机器学习模型生产部署实践，161页pdf，

【2021新书】机器学习模型生产部署实践，161页pdf，

专知会员服务

113+阅读 · 2021年6月11日

【干货书】数值Python计算，Numerical Python，709页pdf

【干货书】数值Python计算，Numerical Python，709页pdf

专知会员服务

116+阅读 · 2021年5月30日

热门VIP内容

开通专知VIP会员享更多权益服务

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《面向无人机集群的避障动态传感器覆盖算法》最新38页

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

相关资讯

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

专知

4+阅读 · 2022年7月16日

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

专知

33+阅读 · 2022年7月15日

【2022新书】设计机器学习系统：生产部署应用的迭代过程，Chip Huyen编著

【2022新书】设计机器学习系统：生产部署应用的迭代过程，Chip Huyen编著

专知

6+阅读 · 2022年7月13日

【2022新书】分布式机器学习Python实战，284页pdf

【2022新书】分布式机器学习Python实战，284页pdf

专知

14+阅读 · 2022年6月11日

【Manning新书】大规模数据结构和算法，306页pdf

【Manning新书】大规模数据结构和算法，306页pdf

专知

13+阅读 · 2022年5月30日

PyTorch官方发布推荐系统仓库: TorchRec

PyTorch官方发布推荐系统仓库: TorchRec

机器学习与推荐算法

4+阅读 · 2022年3月16日

无处不在的 JavaScript

无处不在的 JavaScript

InfoQ

0+阅读 · 2022年3月15日

【干货书】如何编写出牛叉的代码来？Write Great Code第二卷，660页pdf

【干货书】如何编写出牛叉的代码来？Write Great Code第二卷，660页pdf

专知

2+阅读 · 2021年12月5日

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

专知

3+阅读 · 2021年10月24日

21新书《图机器学习GPML》493页pdf阐述图机器学习工业实战技术

21新书《图机器学习GPML》493页pdf阐述图机器学习工业实战技术

图与推荐

14+阅读 · 2021年10月22日

相关基金

大型异构系统上数百万核可扩展的新型区域分裂隐式求解器研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向人脸检测的大规模异构并行Adaboost机器学习算法研究

国家自然科学基金

3+阅读 · 2013年12月31日

面向应用领域的处理器软硬件协同设计关键技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

大规模生物序列比对及其基于异构系统的并行处理技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于纠删码的大规模存储集群重构优化技术

国家自然科学基金

0+阅读 · 2013年12月31日

炼化系统大规模动态与多目标优化的GPU异构并行加速策略及方法

国家自然科学基金

2+阅读 · 2012年12月31日

针对视频分析的高能效异构硬件计算系统研究

国家自然科学基金

1+阅读 · 2012年12月31日

FPGA嵌入式抗辐照容错处理器核及其系统设计实现研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于编译的嵌入式系统优化研究

国家自然科学基金

1+阅读 · 2011年12月31日

众核处理器结构上的并行程序执行模型

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

MobileCodec: Neural Inter-frame Video Compression on Mobile Devices

Arxiv

0+阅读 · 2022年7月18日

A Fast, Autonomous, Bipedal Walking Behavior over Rapid Regions

Arxiv

0+阅读 · 2022年7月17日

On the Practical Power of Automata in Pattern Matching

Arxiv

0+阅读 · 2022年7月17日

S4: a High-sparsity, High-performance AI Accelerator

Arxiv

0+阅读 · 2022年7月16日

Spatz: A Compact Vector Processing Unit for High-Performance and Energy-Efficient Shared-L1 Clusters

Arxiv

0+阅读 · 2022年7月16日

On Scheduling Ring-All-Reduce Learning Jobs in Multi-Tenant GPU Clusters with Communication Contention

Arxiv

0+阅读 · 2022年7月16日

Multi-Agent Simulation for AI Behaviour Discovery in Operations Research

Arxiv

39+阅读 · 2021年8月30日

Deep Learning on Image Denoising: An overview

Arxiv

13+阅读 · 2020年8月3日

已删除

Arxiv

32+阅读 · 2020年3月23日

Image Captioning using Deep Neural Architectures

Arxiv

20+阅读 · 2018年1月17日

微信扫码咨询专知VIP会员