几十年来,不断增长的计算能力一直是许多技术革命背后的推动力,包括最近在人工智能方面的进步。然而,由于集成电路进程规模的放缓,对于系统架构师来说,要继续满足当今应用不断增长的计算需求,他们现在必须采用具有专门加速器的异构系统。

然而,建构这些加速器系统是极其昂贵和耗时的。首先,硬件的开发周期是出了名的长,这使得它很难跟上算法的快速发展。同时,现有的编译器无法导航由新型加速器架构暴露的棘手映射空间。最后算法的设计通常没有将硬件效率作为关键指标,因此,在设计高效硬件方面提出了额外的挑战。

本文解决了联合设计和优化算法、调度和加速硬件设计的重大挑战。我们的目标是通过三管齐下的方法来推进最先进的技术: 开发从高层抽象自动生成加速器系统的方法和工具,缩短硬件开发周期; 适应机器学习和其他优化技术,以改进加速器的设计和编译流程; 以及协同设计算法和加速器,以开发更多的优化机会。

本文的目标应用领域是深度学习,它在计算机视觉、神经语言处理等广泛的任务中取得了前所未有的成功。随着智能设备的普及,可以预见,深度学习将成为我们日常生活中的主要计算需求。因此,本文旨在通过硬件加速进行端到端系统优化,释放前沿深度学习算法的普遍采用,改变生活的各个方面。

https://www2.eecs.berkeley.edu/Pubs/TechRpts/2021/EECS-2021-202.html

成为VIP会员查看完整内容
75

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
106+阅读 · 2021年7月17日
【开放书】《矩阵流形优化算法》,241页pdf
专知会员服务
94+阅读 · 2021年7月3日
【经典书】数据结构与算法,770页pdf
专知会员服务
142+阅读 · 2021年4月15日
专知会员服务
79+阅读 · 2020年12月6日
最新《分布式机器学习》论文综述最新DML进展,33页pdf
专知会员服务
120+阅读 · 2019年12月26日
车路协同构建“通信+计算”新体系
智能交通技术
11+阅读 · 2019年3月26日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
ICLR 2019论文解读:深度学习应用于复杂系统控制
机器之心
11+阅读 · 2019年1月10日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
Deep Learning for Generic Object Detection: A Survey
Arxiv
13+阅读 · 2018年9月6日
Arxiv
6+阅读 · 2018年2月24日
VIP会员
相关VIP内容
专知会员服务
106+阅读 · 2021年7月17日
【开放书】《矩阵流形优化算法》,241页pdf
专知会员服务
94+阅读 · 2021年7月3日
【经典书】数据结构与算法,770页pdf
专知会员服务
142+阅读 · 2021年4月15日
专知会员服务
79+阅读 · 2020年12月6日
最新《分布式机器学习》论文综述最新DML进展,33页pdf
专知会员服务
120+阅读 · 2019年12月26日
相关资讯
微信扫码咨询专知VIP会员