【ETZH博士论文】多精度硬件加速的架构与微架构解决方案

领域专用硬件加速器目前正在革新整个计算系统领域，从大型数据中心平台到小型物联网（IoT）设备。这些加速器显著提高了硬件系统的能效，这一点在今天尤为重要，尤其是随着技术扩展效益逐渐减小以及神经网络（NN）应用所带来的计算需求不断增加。

然而，这些专用单元本质上比通用核心灵活性差。因此，它们通常出现在异构系统芯片（SoC）中，其中一个通用的主处理器与领域专用引擎相结合。这种方法将两者的优点结合起来：通用核心的灵活性和可编程性与硬件加速器的高能效。与此同时，硬件加速器的完全定制性为设计师提供了许多自由度。根据设计的不同，加速器可以是可编程的，也可以是非可编程的，具有更多或更少的专用性。它可以作为独立的硬件模块，或者设计为集成到更通用的系统中，甚至直接集成到处理器流水线中。它可以提供更宽或更窄的带宽来与系统的其他组件进行通信。它既可以是一个小型单元，也可以是一个巨大的系统，通过扩展或扩展特定模块来构建。本论文探索了硬件加速器的各种架构、微架构以及一般的专用化解决方案。首先，我们聚焦于低成本、面积受限的设备，并比较了支持浮点（FP）操作的不同方法：完全基于软件的解决方案、小型多周期浮点单元（FPU）以及高性能流水线FPU。其次，我们分析了两个领域专用的硬件加速器。我们重点关注快速傅里叶变换（FFT）引擎，并比较了独立的缓冲模块与共享内存的无缓冲实现。第三，我们考虑了专用化的另一种途径，通过支持低精度浮点格式和混合精度浮点操作，扩展专用核心集群。第四，我们详细阐述了这一硬件平台，识别了低精度格式引入的一些限制，并进一步增强系统的鲁棒性，使其能够更好地应对破坏性事件。

成为VIP会员查看完整内容

相关内容

博士论文

关注 107

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【NTU博士论文】数据高效的深度多模态学习

专知会员服务

7+阅读 · 1月31日

【博士论文】迈向值得信赖的视觉生成模型：扩散模型的可靠且可控生成

专知会员服务

14+阅读 · 1月27日

【伯克利博士论文】高效深度学习推理的全栈方法

专知会员服务

27+阅读 · 2024年12月22日

【ETHZ博士论文】与多机器人系统的直观与高效互动

专知会员服务

18+阅读 · 2024年11月29日