领域专用硬件加速器目前正在革新整个计算系统领域,从大型数据中心平台到小型物联网(IoT)设备。这些加速器显著提高了硬件系统的能效,这一点在今天尤为重要,尤其是随着技术扩展效益逐渐减小以及神经网络(NN)应用所带来的计算需求不断增加。

然而,这些专用单元本质上比通用核心灵活性差。因此,它们通常出现在异构系统芯片(SoC)中,其中一个通用的主处理器与领域专用引擎相结合。这种方法将两者的优点结合起来:通用核心的灵活性和可编程性与硬件加速器的高能效。 与此同时,硬件加速器的完全定制性为设计师提供了许多自由度。根据设计的不同,加速器可以是可编程的,也可以是非可编程的,具有更多或更少的专用性。它可以作为独立的硬件模块,或者设计为集成到更通用的系统中,甚至直接集成到处理器流水线中。它可以提供更宽或更窄的带宽来与系统的其他组件进行通信。它既可以是一个小型单元,也可以是一个巨大的系统,通过扩展或扩展特定模块来构建。 本论文探索了硬件加速器的各种架构、微架构以及一般的专用化解决方案。首先,我们聚焦于低成本、面积受限的设备,并比较了支持浮点(FP)操作的不同方法:完全基于软件的解决方案、小型多周期浮点单元(FPU)以及高性能流水线FPU。其次,我们分析了两个领域专用的硬件加速器。我们重点关注快速傅里叶变换(FFT)引擎,并比较了独立的缓冲模块与共享内存的无缓冲实现。第三,我们考虑了专用化的另一种途径,通过支持低精度浮点格式和混合精度浮点操作,扩展专用核心集群。第四,我们详细阐述了这一硬件平台,识别了低精度格式引入的一些限制,并进一步增强系统的鲁棒性,使其能够更好地应对破坏性事件。

成为VIP会员查看完整内容
0

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【NTU博士论文】数据高效的深度多模态学习
专知会员服务
7+阅读 · 1月31日
【伯克利博士论文】高效深度学习推理的全栈方法
专知会员服务
27+阅读 · 2024年12月22日
【ETHZ博士论文】与多机器人系统的直观与高效互动
专知会员服务
18+阅读 · 2024年11月29日
【NUS博士论文】视频语义理解中的因果模型
专知会员服务
31+阅读 · 2024年10月30日
【MIT博士论文】高效深度学习计算的模型加速
专知会员服务
28+阅读 · 2024年8月23日
专知会员服务
31+阅读 · 2020年12月21日
智能交通大数据最新论文综述-附PDF下载
专知
22+阅读 · 2019年1月21日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
164+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
425+阅读 · 2023年3月31日
Arxiv
155+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员