“3U”异构融合,中国“芯”迎来新机遇

2022 年 2 月 8 日 CSDN

作者 | 梁晓峣       责编 | 邓晓娟

出品 | CSDN(ID:CSDNnews)

刚刚过去的2021年,世界芯片行业整体颠沛起伏,风波不断。全球范围内的“缺芯潮”引发了包括新能源汽车在内的诸多下游产业产能受阻。同时,国际形势的复杂多变又让原本依赖全球协作的芯片产业链雪上加霜。但与此形成鲜明对比的是,世界的东方风景独好—中国“芯”正在强势崛起。

芯片行业周期性强,去年虽然面临波折,但行业本身仍处于上升周期,尤其是新兴领域如自动驾驶、人工智能、数据中心等领域都有突破性的进展,发生了许多重量级的事件。包括频频登上热搜榜的“元宇宙”概念,这些新生代的应用无一例外都依赖大型数据中心提供的海量算力,无论是人工智能模型的训练还是计算机视觉、自然语言处理等应用,人类社会对算力的需求正以惊人的速度增加,而支持这些算力的基石芯片的重要程度则不言而喻。

因此,本文将重点从大规模算力芯片的角度出发,回顾2021年的相关重要事件,并探讨未来一段时间我国数据中心芯片产业的机遇与挑战。


“热闹非凡”的国产数据中心芯片市场


当前大规模数据中心主要由CPU和GPU两种芯片构成。CPU类似于整个系统的管家,能够从事几乎所有的工作,但对于能够大规模并行处理的任务,GPU的优势得天独厚。随着高带宽、低延迟、数据密集型的计算场景与日俱增,用来分担CPU工作而专门负责网络端数据处理和控制的DPU概念也逐渐兴起。在过去的一年里,这三类芯片的赛道上都有一些里程碑式的事件。

在作为数据中心传统核心的CPU领域, 基于ARM体系的服务器芯片正成为业界关注的热点。虽然基于X86的英特尔处理器仍然占据数据中心绝对的主流地位,但ARM阵营的追赶力度空前并且已经开始形成“农村包围城市”之势。在X86阵营英特尔是绝对的领导者,但ARM阵营内部的竞争从一开始就显白热化。其中亮眼的是华为重磅打造的鲲鹏生态,自2019年发布鲲鹏920芯片后,虽然遭遇了技术封锁,但华为仍将大量资源投入到该生态的建设中。经过几年的发展,鲲鹏生态攻城掠地,逐步建立了一个覆盖服务器、操作系统、云平台、软件和应用在内的完整生态,其着力打造的服务器端兼容X86生态的理念已经取得阶段性成果,可以说是目前落地程度最高的基于ARM体系的服务器芯片。

图片来源:东方IC

而ARM架构的潜力也吸引了其他行业巨头的注意。阿里巴巴旗下半导体公司平头哥去年首发了倚天710,尝试依靠自身的巨大需求,带动一个爆款的芯片产品,但目前尚未形成类似鲲鹏的生态,这种商业模式最终能否成功仍需要时间证明。而国际巨头英伟达携GPU异军突起之势,尝试直接收购ARM公司,可谓“野心”勃勃。但该举动饱受各国监管机构阻挠,虽然英伟达和ARM两情相悦,但恐怕还是会落得“棒打鸳鸯两头散”的结局。

图片来源:东方IC

另一边如日中天的GPU则是近年来数据中心芯片里的C位网红。当前流行的如人工智能训练和推理、计算机视觉、自然语言处理、搜索推荐等应用场景无一例外都是以GPU作为算力担当,充分利用GPU擅长并行计算的特点,逐渐形成了围绕GPU打造的“算力中心”的概念。在这一领域,当今世界两大GPU巨头英伟达和AMD都顺势转型开发出以通用计算为主导的GPGPU,尤其是英伟达凭借其先发的CUDA生态优势已经占据了绝对的统治地位,其发布的各类型计算加速卡,几乎垄断了整个市场。但去年真正精彩的则是国内一众的GPU厂商,成为当下资本的宠儿,几乎每个月都有爆出大额融资的新闻,令人叹为观止。

目前国内的GPU厂商总体有三种发展思路:第一种是以景嘉微为代表的纯图形渲染GPU公司,去年发布的新产品JM9系列,基本追上了英伟达GTX1050的水平,在国产桌面系统的显示替代层面取得了长足的进步。此类公司由于专注于开发图形图像的处理芯片技术,短期内不会进入数据中心市场。其他一些初创企业如摩尔线程等也是采取类似的打法。

第二种思路是专攻数据中心市场,完全舍弃GPU中的图形渲染能力,将有限的硬件资源集中投入到通用计算中,以至于专门针对人工智能等应用引入细致的优化,期待和英伟达的GPU形成差异化竞争,达到“术业有专攻”的目的。目前国内寒武纪、天数智芯和燧原科技等公司都是采用类似的思路,在去年也陆续发布了新产品,目前均处于建生态和拼落地的阶段。

 

第三种思路则是真正的全面对标英伟达,即同时布局图形渲染和通用计算两条线,目前了解到的国内GPU企业仅壁仞科技选择了这种方式,属于“艺高人胆大”。策略是以通用计算为主,图形渲染为辅,以数据中心的人工智能算力需求为主战场,同时兼顾未来云游戏、高清视频和元宇宙的需求。壁仞科技的首款GPU芯片已于去年底交付流片,这家雄心勃勃的公司究竟是骡子是马,今年当可拭目以待。

作为数据中心的新宠DPU,相较于传统的CPU和GPU,是一个相对新颖的概念,以至于到今天业界对DPU的定义还众说纷纭、莫衷一是。DPU芯片的设计初衷是分担CPU的工作,专门用来处理和数据层面传输协议相关的工作,从而提升系统的整体效率。DPU的概念最早由硅谷创业公司Fungible提出,其定义的主要功能是协助CPU和GPU进行数据传输、存储、交换协议、加解密、加解压缩以及一些初级的数据分析等。在英伟达收购Mellanox并正式以DPU命名后,这个概念一炮而红。随后,DPU的赛道吸引了大量资本的关注,业界普遍认为DPU是继CPU和GPU之后构建数据中心的第三种重要芯片,未来将形成“三足鼎立”之势。仅在2021年,国内就有近10家DPU公司成立并宣布获得融资。其中有传统领域的大厂高管自立门户创立企业,也不乏互联网巨头亲自下场抢滩赛道。

 

但正是由于业内对于DPU的定义尚未统一,因此各家也根据自身的理解采取了不尽相同的策略。英伟达的DPU主要面向数据安全、网络、存储的卸载,发展的重点仍然是依托自家GPU的发展思路,推出“DPU版的CUDA”— DOCA,大有依托现有软硬件生态进一步形成产业壁垒的势头。在国内的DPU厂商中,中科驭数将重心放在异构核的设计上,即以针对性的加速核,配以专利的KPU技术来组织这些异构核。云脉芯联想要通过可编程的创新架构,以极高的能效比满足用户定制化需求的灵活性,实现DPU的核心能力和主流功能。星云智联则是希望在IAAS和PAAS之间形成独立的CAAS(通信服务层),实现物理资源的“多虚一”和近乎裸金属性能的“一虚多”。云豹智能等则提出采用基于ARM的大小核结构来实现网络数据任务的卸载并保留相对灵活的能力。


“分久必合”,实现数据中心的“3U”异构融合


过去的2021年,CPU、GPU、DPU作为行业的三驾马车,不仅呈现出齐头并进的态势,还出现了异构计算系统“3U”融合的萌芽,这一点特别值得关注。

回顾三马车的发展历程,不难发现,人工智能等兴起的应用正在急速推动算力的需求并由此产生一系列的新变化。原本单一的计算架构往往会力不从心,需要引入新的计算架构来应对不断涌现的新场景、新应用和新需求。随着CPU尤其是GPU算力的不断提升,数据的传输和存储就成为系统的“瓶颈”,DPU也就应运而生了。

如果说数据中心场景的多样化需求催生出不同类型的芯片是“合久必分”的话,那我们认为未来在计算系统的整体架构层面会出现“分久必合”的情形,会呈现“分于芯片,合于体系”的趋势。针对计算任务的不同特点,芯片的架构将可能更为细分,通过不同的形式去实现最高的计算效能,也就是所谓的领域专用芯片。但在整体系统层面,则强调融合,不同架构的芯片通过一个统一整合的编程框架和计算体系实现合力,更为步调一致的输出强大的算力。

业界已有不少先行者看到了这一趋势并展开了相关的布局。依靠GPU逆袭成功的英伟达,在去年的技术论坛GTC上首次提出“GPU+CPU+DPU”的“3U”一体化战略。同时,CPU巨头英特尔也不甘落后,在充分利用自身CPU优势的同时,也在积极布局融合集成,不仅收购了智能芯片初创公司Habana,更是公布了基础设施处理器(IPU)的概念与英伟达相抗衡。而国内由于缺乏类似的芯片巨头,目前明确提出相关概念的企业少之又少,从市场透露的信息中隐约看到壁仞科技通过战略投资CPU和DPU等初创公司正在进行早期布局,但其真实的战略意图和具体的执行路径依然神秘。


“连横”VS.“合众”,大国芯片之争的发展战略


“3U”异构融合可以分为两种发展路线:其一是“连横”路线,即由一家芯片巨头通过自研新品、收购公司、购买专利等方式,形成全覆盖的产品矩阵以囊获尽可能多的算力架构;另一种是“合众”路线,通过市场上专精于不同芯片架构的多个企业建立广泛的产业联盟和产业生态,分工合作、众志成城,共同构建异构融合数据中心的研发体系。

那么在大国激烈竞争的新态势下,“连横”与“合众”,这两种路线孰优孰劣呢?

我们首先来分析“连横”路线,目前有清晰布局的是美国的芯片巨头英伟达、英特尔和AMD。以英伟达为例,在CPU层面高调宣布基于ARM的Grace CPU等宏大布局,而其在GPU领域更是一骑绝尘,在DPU方面通过收购Mellanox进行深度的产品整合,再加上其CUDA生态的垄断地位,迅速推动了异构融合概念的普及。“连横”模式能够充分利用寡头企业在某一优势领域的垄断地位,通过“夹带私货”或“强买强卖”的方式迅速带动其他产品的销售并进而形成新的核心竞争力。

但是必须注意的是“连横”模式也有其天然的劣势。相对而言,国际芯片巨头的发展历史都比较长,其产品往往背负了很强的历史包袱,即便面对全新的应用也很难进行大刀阔斧的改革和创新,往往采取小修小补的方式去迭代,更新速度慢,在情感上抵制使用革命性的技术。比如在GPU领域,一众国内初创企业敢于挑战巨头英伟达,正是瞄准寡头过于沉重的历史包袱,希望利用新兴的市场机会实现跨越式发展,即所谓变道超车。我们也确实看到,无论是英伟达还是英特尔,正是因为在某个领域长期占据霸主地位,当面对新兴市场的冲击,就可能陷入思维定势,试图以老革命来解决新问题。“昔日之蜜糖,今日之砒霜”,历史不断证明这样的思维定式在关键时刻往往会成为创新的阻力。另一方面,过于强大的芯片寡头也会让下游的集成商和应用商产生顾虑,害怕失去话语权和议价权,从而寻找可能的替代方案。

至于另一条“合纵”路线,在“3U”异构融合方面还没有出现成功的践行者。但我们不妨从移动计算的发展历史中寻找“他山之石”。当年营收尚不足英特尔零头的ARM体系之所以能够在移动端胜出,正是因为采用了这种“合众”模式,组成了拥有苹果、高通、联发科、三星等企业的强大联盟,“众人拾柴火焰高”,最终占据了移动市场绝大部分的份额。这种模式在我国缺乏行业寡头的现状下优势尤为明显,能够汇集国内各个领域最具优势的企业,通过一个开放的生态和联盟推动更好的创新,实现后发优势,所谓“三个臭皮匠顶个诸葛亮”。这种模式的另一个优点是将鸡蛋分散在不同的篮子中,有效避免被制裁的系统性风险。

尽管过去的一年国内在CPU、GPU、DPU三大领域动作频频,行业发展如火如荼,但总体来说缺乏真正技术领先的企业,在这三大领域几乎全部处于被动追赶的阶段。国内目前更加缺乏能够领导重塑整个计算体系和生态融合的领军企业,虽然任重道远,但对于缺乏巨头的中国芯片产业而言,“合众”仍然是我们最大的机会所在,也不失为大国差异化竞争的有效手段。


利用体制、革新技术、创新理念、突破未来


“3U”异构融合是数据中心发展的新态势,对于国内芯片产业来说,“合众”路线是和寡头竞争的有效手段,是时代赋予的历史性机遇。要想实现对国外巨头的追赶和超越,总结起来我们的机会在于体制创新、技术创新和理念创新。

芯片产业的发展归根结底有三大要素:资本、人才和市场。体制创新是指我国特有的集中力量办大事的能力。在资本上,牢牢把握住近年来掀起的投资热潮,用好用足涌入赛道天量资金的同时也要注意全局统筹、合理调配并防止踩踏;市场一直是我们的优势,要充分利用市场层出不穷的应用场景,以及来自政府和产业上下游的资源导入;在人才上要正视国内芯片人才短缺的现状,加强人才培养和产学研合作机制,不拘一格引进海外优秀人才,尽快补齐人才短板。

技术创新是指敏锐抓住数据中心“3U”异构融合的行业变革大机遇,打造创新型的计算生态体系。国内的芯片企业没有历史包袱,很多都处于初创期,也不存在股市业绩的压力,面对硬科技行业,投资人也表现出了相当程度的宽容。这些企业完全可以胆子大一点,步子放开一些,重点关注近年来产生的突破性技术,在计算架构上适当进行超前的创新设计,着力面向新兴的应用和场景,前置性地布局下一代芯片体系结构,力争在“3U”合一的赛道上实现后发制人。

理念创新则是最想呼吁也是最为关键的一点,“合众”路线是中国芯片行业实现超越的合理选择,类似于软件和互联网产业深入人心的“开源”精神,已经证明了开源生态在对创新活力的巨大激发后是有机会挑战行业巨头的。因此,我们完全可以考虑在数据中心芯片的异构融合发展中引入开放生态的概念,并尝试建设一系列有影响力的开源项目,树立旗帜、亲密协作、优势互补,形成合力,只有这样我国的芯片行业才能像生机勃勃的互联网一样,后来居上、欣欣向荣。

作者简介:

梁晓峣,上海交通大学计算机科学与工程系教授,副系主任
梁晓峣,上海交通大学计算机科学与工程系教授,副系主任。上海青年五四奖章获得者。博士毕业于哈佛大学。研究方向包括计算机体系结构,AI芯片设计以及GPU架构等。发表论文100余篇,引用超1500次,包括国际顶级学术会议ISCA, HPCA, MICRO, ISSCC等,在计算机体系结构三大顶会共发表11篇论文,两次入选计算机体系结构年度最佳论文。编著的《昇腾AI处理器架构与编程》获清华出版社年度畅销书奖,成为AI芯片领域流行的参考书。

新程序员003》正式上市,50余位技术专家共同创作,云原生和数字化的开发者们的一本技术精选图书。内容既有发展趋势及方法论结构,华为、阿里、字节跳动、网易、快手、微软、亚马逊、英特尔、西门子、施耐德等30多家知名公司云原生和数字化一手实战经验!

   
   
     
Flutter稳定支持Windows,开发者做好准备了吗?
B站回应员工因加班猝死;英伟达收购ARM宣告失败;GitHub推出只有赞助者能访问的私有库|极客头条
从个人英雄到万能开发者,程序员3.0时代到来
登录查看更多
1

相关内容

阿里云发布《中国云原生数据湖应用洞察白皮书》
专知会员服务
42+阅读 · 2022年4月15日
2021—2022中国人工智能计算力发展评估报告,36页pdf
专知会员服务
70+阅读 · 2021年11月6日
2021互联网行业挑战与机遇白皮书
专知会员服务
24+阅读 · 2021年11月1日
专知会员服务
75+阅读 · 2021年8月3日
专知会员服务
153+阅读 · 2021年6月10日
多样性算力技术愿景白皮书
专知会员服务
82+阅读 · 2021年4月29日
2021年中国人工智能产业发展趋势,13页pdf
专知会员服务
118+阅读 · 2021年3月18日
《人工智能计算中心白皮书》,43页pdf
专知会员服务
154+阅读 · 2021年3月5日
专知会员服务
87+阅读 · 2021年3月3日
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
一场数据架构变革正在来临 | Q推荐
InfoQ
0+阅读 · 2021年12月20日
2021年中国人工智能市场发展现状
专知
1+阅读 · 2021年10月29日
多样性算力技术愿景白皮书
专知
0+阅读 · 2021年4月29日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
8+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Verified Compilation of Quantum Oracles
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
3+阅读 · 2022年4月18日
VIP会员
相关VIP内容
阿里云发布《中国云原生数据湖应用洞察白皮书》
专知会员服务
42+阅读 · 2022年4月15日
2021—2022中国人工智能计算力发展评估报告,36页pdf
专知会员服务
70+阅读 · 2021年11月6日
2021互联网行业挑战与机遇白皮书
专知会员服务
24+阅读 · 2021年11月1日
专知会员服务
75+阅读 · 2021年8月3日
专知会员服务
153+阅读 · 2021年6月10日
多样性算力技术愿景白皮书
专知会员服务
82+阅读 · 2021年4月29日
2021年中国人工智能产业发展趋势,13页pdf
专知会员服务
118+阅读 · 2021年3月18日
《人工智能计算中心白皮书》,43页pdf
专知会员服务
154+阅读 · 2021年3月5日
专知会员服务
87+阅读 · 2021年3月3日
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
8+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员