“来源:专用数据处理器(DPU)技术 白皮书,中国科学院计算技术研究所,鄢贵海等”
10月16日至17日,中国计算机学会第二届集成电路设计与自动化学术会议(以下简称CCF DAC)在武汉举行,由中科院计算所主编,计算机体系结构国家重点实验室、中科驭数、中国计算机学会集成电路设计专业组联合编写的行业内首部专用数据处理器(DPU)技术白皮书在大会DPU主题分论坛发布。
DPU技术白皮书封面
DPU技术白皮书重点分析了DPU产生背景、技术特征、软硬件参考架构、应用场景、并对目前已经公布的DPU产品做简要的比较分析,为后续DPU技术发展提供了技术路线参考。白皮书内容共分为六个章节,分别为DPU技术发展概况、特征结构、应用场景、软件栈五层模型、业界产品概要介绍、DPU发展展望。
大会主席、中科院计算所计算机体系结构国家重点实验室研究员李晓维宣布DPU技术白皮书正式发布,表示希望以DPU技术白皮书的发布作为起点,后续能指导DPU在现有数据系统和计算机产业中的应用,并促进行业对DPU这类新型算力芯片的技术发展及应用的探讨。
李晓维研究员发布DPU技术白皮书
专用数据处理器技术白皮书
DPU(Data Processing Unit)是新近发展起来的一种专用处理器。2020年 NVIDIA公司发布的DPU产品战略中将其定位为数据中心继CPU和GPU之后的 “第三颗主力芯片”,掀起了一波行业热潮。DPU的出现是异构计算的一个阶 段性标志。与GPU的发展类似,DPU是应用驱动的体系结构设计的又一典型案 例;但与GPU不同的是,DPU面向的应用更加底层,类型也更多样。DPU要解 决的核心问题是基础设施的“降本增效”,即将“CPU处理效率低下、GPU处 理不了”的负载卸载到专用DPU,提升整个计算系统的效率、降低整体系统的 总体拥有成本(TCO)。新一代的DPU不仅可以作为运算的加速引擎,还具备 控制平面的功能,能够运行Hypervisor,更高效的完成网络虚拟化、IO虚拟化、 存储虚拟化等任务,彻底将CPU的算力释放给应用程序。DPU的出现也许是体 系结构朝着专用化路线发展的又一个里程碑。
本白皮书将重点分析DPU产生的背景、技术特征、软硬件参考架构,应用 场景、并对目前已经公布的DPU产品做简要的比较分析,为后续DPU技术发展 提供必要的参考。本文的大体结构如下:第一部分介绍DPU的技术发展概况,首先对DPU做了一个基本的定义,然 后阐述了DPU发展的背景,并简要介绍DPU发展的历程,DPU在现有计算生态 中的角色,最后以DPU的产业化机遇作为总结。第二部分详细说明DPU的特征结构,对DPU的定位做了进一步阐述,然后 提出一种通用的DPU的结构模型。第三部分介绍DPU的应用场景,本文总结了三大应用场景:网络功能卸 载、存储功能卸载、安全功能卸载,这也是DPU目前最重要的三个应用方向。第四部分提出DPU开发的五层参考模型,包括设备层、操作层、计算引擎 层、应用服务层和业务开发层,既体现了DPU开发过程中的软硬协同,也充分 继承了通用软件栈的分层结构。第五部分概要介绍目前行业的已经发布或已经披露的DPU产品,虽然其中 绝大部分尚未到批量应用的阶段,各个竞品的优缺点也尚未得到市场的充分验 证,但是对于后续DPU研发具有重要的参考价值。第六部分展望未来DPU发展,并作为全文的总结。
DPU(Data Processing Unit)是以数据为中心构造的专用处理器,采用软件 定义技术路线支撑基础设施层资源虚拟化,支持存储、安全、服务质量管理等 基础设施层服务。2020年NVIDIA公司发布的DPU产品战略中将其定位为数据中 心继CPU和GPU之后的“第三颗主力芯片”,掀起了一波行业热潮。DPU的出 现是异构计算的一个阶段性标志。与GPU的发展类似,DPU是应用驱动的体系 结构设计的又一典型案例;但与GPU不同的是,DPU面向的应用更加底层。DPU要解决的核心问题是基础设施的“降本增效”,即将“CPU处理效率低 下、GPU处理不了”的负载卸载到专用DPU,提升整个计算系统的效率、降低 整体系统的总体拥有成本(TCO)。DPU的出现也许是体系结构朝着专用化路 线发展的又一个里程碑。
DPU的出现是异构计算的又一个阶段性标志。摩尔定律放缓使得通用CPU 性能增长的边际成本迅速上升,数据表明现在CPU的性能年化增长(面积归一 化之后)仅有3%左右1,但计算需求却是爆发性增长,这几乎是所有专用计算芯 片得以发展的重要背景因素。以AI芯片为例,最新的GPT-3等千亿级参数的超 大型模型的出现,将算力需求推向了一个新的高度。DPU也不例外。随着2019 年我国以信息网络等新型基础设施为代表的“新基建”战略帷幕的拉开,5G、 千兆光纤网络建设发展迅速,移动互联网、工业互联网、车联网等领域发展日 新月异。云计算、数据中心、智算中心等基础设施快速扩容。网络带宽从主流 10G朝着25G、40G、100G、200G甚至400G发展。网络带宽和连接数的剧增使得 数据的通路更宽、更密,直接将处于端、边、云各处的计算节点暴露在了剧增 的数据量下,而CPU的性能增长率与数据量增长率出现了显著的“剪刀差”现 象。所以,寻求效率更高的计算芯片就成为了业界的共识。DPU芯片就是在这 样的趋势下提出的。
DPU发展历程 随着云平台虚拟化技术的发展,智能网卡的发展基本可以分为三个阶段 (如图1-2所示):
DPU正在开启一个巨大的产业化趋势,可以为下一代数据中心、5G边缘计算、云计算提供核心组件。 产学研用一体化、上下游企业协同,才能营造更良性的DPU产业生态,打造出更高效的DPU产品和解决方案,不断满足各个行业的对高效算力的需求。
参考链接:
http://www.ict.cas.cn/xwgg/jssxw/202110/t20211021_6226618.html
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DPU” 就可以获取《中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》,94页pdf》专知下载链接