卷积神经网络的加速器 全面而彻底的资源,探索不同类型的卷积神经网络和配套的加速器。 《卷积神经网络的加速器》提供了基础的深度学习知识,并为物联网(IoT)和边缘计算从业者构建卷积神经网络(CNN)加速器提供了指导内容。本书阐述了CNN的压缩编码,提出了两步无损输入特征图压缩方法,讨论了基于算术编码的无损权重压缩方法和相关的解码方法,描述了考虑权重和激活图稀疏性的现代稀疏CNN,并讨论了可以更好地优化和利用CNN加速的可用硬件资源的硬件/软件协同设计和协同调度技术。 本书的第一部分提供了CNN的概述,以及不同现代CNN模型的组成和参数。后面的章节主要关注CNN的压缩编码和密集CNN加速器的设计。本书还为CNN加速器的未来研究和发展提供了方向。 《卷积神经网络的加速器》涵盖的其他样本主题包括: 如何应用算术编码和解码,带有范围缩放,进行5位CNN权重的无损压缩,以在极度资源受限的系统中部署CNN 围绕密集CNN加速器的最新研究,主要基于脉冲阵列或并行乘累加(MAC)阵列 iMAC密集CNN加速器,结合了图像到列(im2col)和通用矩阵乘法(GEMM)硬件加速 多线程、低成本、基于日志的处理元件(PE)核心,这些实例在空间网格中堆叠,以产生NeuroMAX密集加速器 Sparse-PE,一个多线程且灵活的CNN PE核心,利用权重和激活图的稀疏性,其实例可以在空间网格中堆叠,以产生稀疏CNN加速器 对于AI、计算机视觉、计算机架构和嵌入式系统的研究人员,以及相关学科的研究生和高年级本科生,《卷积神经网络的加速器》是理解该主题的多个方面和相关应用的必备资源。