分形计算系统

在许多领域,编程成本已经成为阻碍计算机技术应用发展的主要瓶颈问 题:超级计算机性能走向百亿亿次级别,然而现代超级计算机发展趋势是采用 异构运算部件,导致编程困难的问题越来越严峻;在物端边缘计算领域,设备 数量和种类呈现爆炸式增长,而应用程序开发者不可能针对上百亿种异构设 备进行编程,产生了“昆虫纲悖论”;在机器学习领域,编程框架 TensorFlow 的代码规模已经突破 400 万行,为机器学习或深度学习开发领域特定加速器产 品的主要成本已经来源于配套软件生态的研发。

编程难题包括并行编程难、异构编程难、大规模系统编程难、跨系统编程 难等诸多表现形式。学位论文拟提出分形计算概念,通过分形计算系统的研究 以回应编程难题;具体来说,分形计算系统针对来源于“编程-规模相关性”的 编程难题提供了解决方案。具体贡献包括:

• 提出分形计算模型(FPM),一种采用了层次同性原理的通用并行计算 模型。分形计算模型具有编程-规模无关性,是一种串行编程、并行执 行的模型。使用者只需编写串行的程序,该计算模型可以自动展开至任 意规模的系统上并行执行,因此可以在通用领域解决来源于编程-规模 相关性的编程难题。

• 提出分形冯·诺伊曼体系结构(FvNA),一种采用了层次同性原理的专 用并行体系结构。相同任务负载在不同规模的分形冯·诺依曼体系结构 计算机上可以分别自动展开、执行,因此可以做到对一系列不同规模的 计算机仅需进行一次编程。以机器学习领域专用体系结构为例,本文实 现了一系列分形机器学习计算机 Cambricon-F,以解决机器学习计算机 编程困难的问题。实验结果表明,Cambricon-F 在改善了编程生产率的 同时,还能获得不劣于 GPU 系统的性能和能效。

• 提出可重配分形指令集结构(FRISA),一种按照分形计算模型设计的 分形计算机指令集结构。分形可重配指令集结构能够在分形冯·诺依曼 体系结构计算机上定义任意的分形运算,因此可以支持实现分形计算模型,形成通用分形冯·诺依曼体系结构计算机。以机器学习领域专用体 系结构为例,本文在 Cambricon-F 的基础上实现了一系列可重配的分形 机器学习计算机 Cambricon-FR,以解决 Cambricon-F 在新兴机器学习应 用上遇到的失效现象。实验结果表明,Cambricon-FR 在解决了失效现 象、提高系统运行效率的同时,还能通过定义分形扩展指令缩短描述应 用所需的分形指令串的长度。

成为VIP会员查看完整内容
33

相关内容

【博士论文】多视光场光线空间几何模型研究
专知会员服务
22+阅读 · 2021年12月6日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
专知会员服务
13+阅读 · 2020年12月17日
【博士论文】解耦合的类脑计算系统栈设计
专知会员服务
30+阅读 · 2020年12月14日
专知会员服务
73+阅读 · 2020年12月7日
大规模时间序列分析框架的研究与实现,计算机学报
专知会员服务
58+阅读 · 2020年7月13日
【AI芯片】计算芯片——大数据和人工智能的基石
产业智能官
9+阅读 · 2020年3月8日
【边缘计算】边缘计算面临的问题
产业智能官
17+阅读 · 2019年5月31日
SysML 2019论文解读:推理优化
机器之心
4+阅读 · 2019年4月11日
ICLR 2019论文解读:深度学习应用于复杂系统控制
机器之心
11+阅读 · 2019年1月10日
Arxiv
0+阅读 · 2022年2月7日
Arxiv
0+阅读 · 2022年2月7日
VIP会员
相关VIP内容
微信扫码咨询专知VIP会员