会员服务 ·

美国重夺全球超算第一！人类实现百亿亿次E级超算，Frontier屠榜全球Top500

2022 年 5 月 31 日 新智元

新智元报道

编辑：好困 David 袁榭

【新智元导读】最新超算Top500榜单揭晓！美国的性能怪兽Frontier以横扫之势拿下第一，算力超过身后468台的总和。

已经霸榜两年，完成四连冠的日本富岳终于跌落了「神坛」。

在刚刚公布的2022年全球超算Top500名单中，美国橡树岭国家实验室（ORNL）的Frontier夺得第一。

凭借1.102 Exaflop/s的HPL分数，Frontier不仅是有史以来最强大的超级计算机，它也是第一台真正的「E级超算」。

相比之下，中国的神威·太湖之光和天河二号排名下滑至第六和第九。

去年，美国将神威·太湖之光的处理器供应商申威列入了实体清单，或多或少给中国超算的发展造成了影响。

这次Top500的64位浮点计算总算力为4.4 exaflops，比六个月前的上一期榜单增长了44.7%。

Frontier：突破百亿亿次

那么，Frontier的性能到底达到了怎样「逆天」的程度呢？！

简单来说，就是把排在它之后的7个超算的算力加起来，都比不过一个Frontier。

除了如此炫目的算力之外，Frontier还是全球跑AI最快的超级电脑之一。在HPL-AI基准的混合精度性能测试中，Frontier跑出了6.88 ExaFlops的成绩。

用白话说，这个性能相当于，给一个860亿神经元组成的智能体中的每个神经元，每秒都下达6800万个指令。

用这个训练AI大模型，那可真是火箭发动机搭上了一级方程式赛车，可以直接在赛道上起飞。

全新的Frontier占地372平方米，由74个HPE Cray EX机柜组成，可容纳9408个节点。

其中，每个节点有一个AMD Milan 「Trento」 7A53 Epyc CPU，搭配512GB DDR4内存和4个AMD Radeon Instinct MI250X GPU。

总的来说，该系统有602,112个CPU核心，与4.6PB的DDR4内存相连接。

此外，37,888个AMD MI250X GPU具有8,138,240个核心，并搭配了4.6PB的HBM内存（每个GPU有128GB）。

CPU和GPU使用基于以太网的HPE Cray Slingshot-11网络结构进行连接。

储存上则与一个性能极佳的存储子系统相连，有着700PB的容量，75TB/s的吞吐量和150亿IOPS的性能。

元数据层分布在480个NVMe SSD上，提供10PB的整体容量，而5400个NVMe SSD为主要的高速存储层提供11.5PB的容量。

同时，47,700个PMR硬盘提供679PB的容量。

散热方面，基于水冷的系统让6000加仑的水在350马力的泵在整个系统中「移动」，由此将温度控制在了85度左右。

直观来说，这些水泵可以在30分钟内填满一个奥林匹克标准游泳池。

Frontier不仅是现在世界上最快的超算，也是最环保的超算。

Frontier的能耗比，亦居全球超算的环保程度Green500榜单之首。单个由第三代AMD的Epyc处理器与Instinct MI250x加速器组建的机柜单元，其能耗效率是每瓦电能运算62.68 gigaflops。

不过，想把Frontier组装起来可不容易，ORNL必须采购685个不同编号的6000万个部件。

此外，在建造过程中还不得不去应对芯片的短缺。

ORNL受影响的零件编号有167个，算下来是200万个零件。而AMD缺少MI200 GPU的15个编号的零件。

于是ORNL与ASCR合作，为这些零件获得了国防优先权和分配系统（DPAS）评级，这意味着美国政府可以使用年度的防务预算，用显著高于市场价的更优厚价格来采购这些部件。

很快，「短缺」的问题也就得到了解决。

经过这波操作，是不是可以解开很多人心中所谓的「疑惑」了呢？

美国：为了我们的国防事业，加大力度搞超算！

虽然这么花钱，但用处不可谓不广。在英伟达老黄这种财主老爷都要做地球数字孪生体的时代，各国官方部门的超级计算机在开发处理庞大数据的AI、模拟气候和产业用途等方面越来越重要。

就算橡树林自己用不完这算力，也可以租、售嘛，工业界对算力可是嗷嗷待哺。

而且这已有他国先例：在预测机床材料加工结果的实验中，日本DMG森精机床自带工业电脑需要8小时，但富岳只需要10分钟就完成了。

中国：玩你们的，我就看看

在新一期榜单上，中国和美国仍然是上榜最多的国家。

在上榜超算数量上，中国仍为173台，和上期持平，继续位列榜首。美国从上期的150台下降到127台，排名次席。尽管如此，这两个国家仍然占了TOP 500榜单总数的60%。

日本、德国、法国分别以34、31、22台位列3-5位。

虽然此次Frontier正式成为世界上最强大的超级计算机，但它还没有与去年被曝光的两个中国超算进行比较。

不过，这两个系统目前都没有向Top500提交测试数据。

根据爆料的数据，有不少外媒推断Sunway OceanLight（神威·海洋之光）超级计算机在HPL基准上的峰值约为1.3 exaflops/1.05 exaflops，而天河三号则能够达到1.7 exaflops峰值/1.3 exaflops持续值。

然而，考虑到美国在芯片上的各种「卡脖子」，中国超算刷榜的后果很有可能就变成了一个制裁的「靶子」，想必短时间内应该不会看到任何有关数据的更新了。

上榜数量占比上，中国以34.6%的比例占据榜首，美国以25.4%的比例位列第二，中美争霸的态势依旧。

而在总性能排行榜上，美国的优势仍然不可动摇，以47.3%的总算力牢牢占据首位，不难看出，此次登顶的Frontier为美国稳定霸榜贡献不小。

此外，此次Top 500榜单还统计了自1990年起超算算力的进步趋势，并进行了线性回归。

表中横轴为时间，纵轴为算力（取对数）。

绿色点为上榜超算的总算力，黄色三角为榜单冠军的算力，蓝色方块为榜单倒数第一（第500名）超算的算力。对应颜色的直线为线性回归的结果。

可以看到，这三条直线大致符合摩尔定律的对算力提升的预测性判断。

都说摩尔定律已死，看起来在超算领域，它还活的很好很健壮。

欧洲崛起：Top10占据7席

美国并不是唯一取得显著成绩的地区。欧洲也表现良好，从总排名上看，美、中、日占据前3，前十中剩余的七席则全部为欧洲国家占据。

其中德国上榜31台，法国上榜22台，意大利上榜14台。

芬兰新部署的LUMI超级计算机以151.9 petaflops的FP64性能勉强超过美国的Summit，获得第3名。

另外，法国GENCI-CINES的Adastra以46.1 petaflops的性能险些夺得第10名。虽然远不及LUMI强大，但Adastra仍然保持着欧洲第二强大的超级计算机的殊荣。

LUMI和Adastra等系统也说明了另一个趋势。与Frontier一样，它们基于HPE的全AMD Cray EX平台，使用第三代Epyc CPU和Instinct GPU。

为啥不用GPU加速：还是差钱

长久以来，AMD第一次在Top500中的系统内的主机CPU中占有代表性的份额，但英特尔至强处理器仍然占主导地位。

从本世纪初开始，英特尔在高性能计算领域开始发力，只用了几年时间，就将IBM、惠普等几家之前的主要玩家排挤得元气大伤。

从2017年到2020年，英特尔在高性能计算领域达到极盛的市场占有率一度超过90%。

直到目前，英特尔的份额仍高达77.4%，下降了4.2个百分点，而AMD的份额正好上升了这个数字。预计Epycs会在与Xeon SP的竞争中获得更大的动力。

而且，AMD有后来居上的势头。在2022年的全球超算Top500榜单中，现在有94台超算依赖AMD的产品，年度增长95%。而且AMD的 Instinct MI200 加速器首次被其中7台超算采用。

另一个问题是，为什么不用GPU加速器？可能是因为贵？

GPU加速器作为计算引擎，可以提升巨大的性能和性价比，但目前，加速器并没有在Top500榜单上的超算架构中占据主导地位。这些GPU加速器主要是英伟达的。

但是，除了英伟达自家的HPC中心有大量应用需要移植到GPU上，而且不差钱之外，世界上成千上万的其他HPC中心还是差钱的，这些HPC的代码是明确为CPU编写的。

目前的Top500榜单中，只有170台超算采用了GPU加速器--当然大部分来自英伟达。

另一个因素是，更便宜的CPU本身现在也在陆续添加类似于GPU的加速计算功能，比如向量和现在的矩阵计算等。

这样就比将CPU程序转移至GPU运行更省钱，也更容易编程。我们可能永远不会看到一个主要由GPU加速系统组成的Top500榜单了。

事实上，在「富岳」、「太湖之光」这样排名靠前的超算系统中，CPU基本上充当了具备向量和矩阵计算型GPU的作用。

参考资料：

https://www.top500.org/news/ornls-frontier-first-to-break-the-exaflop-ceiling/

https://www.nextplatform.com/2022/05/30/at-long-last-hpc-officially-breaks-the-exascale-barrier/

https://www.nytimes.com/2022/05/30/business/us-supercomputer-frontier.html

登录查看更多

相关内容

内存

关注 0

虚拟人创作更真更快！浪潮信息联手NVIDIA打造元宇宙算力方案

专知会员服务

22+阅读 · 2022年7月25日

【高超音速武器】2022年5月最新报告《Hypersonic Weapons》美国国会研究处

专知会员服务

52+阅读 · 2022年5月8日

高性能计算专家Jack Dongarra获2021年图灵奖

专知会员服务

17+阅读 · 2022年3月30日

最新元宇宙白皮书：做虚实融合世界的赋能者

专知会员服务

110+阅读 · 2022年1月14日

重磅！2021年智源「人工智能」前沿报告（AI Frontiers）发布，236页pdf

专知会员服务

156+阅读 · 2022年1月1日

中国信通院发布《下一代数据存储技术研究报告（2021年）》（附pdf）

专知会员服务

46+阅读 · 2021年7月13日

【KDD2021】面向时空数据建模的跨节点联邦图神经网络

专知会员服务

64+阅读 · 2021年6月11日

5篇TPAMI-2021《图神经网络》论文快读！

专知会员服务

52+阅读 · 2021年5月30日

《2021年中国AIoT产业全景图谱》白皮书，244页pdf

专知会员服务

131+阅读 · 2021年1月16日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

NASA「史上最强超算」投入使用，碾压老超算霸主Pleiades

新智元

1+阅读 · 2022年7月21日

首台E级超算登顶Top500榜单：算力超过后七名之和

机器之心

1+阅读 · 2022年5月31日

AMD将成全球首个E级超算供应商？美国Frontier超算全AMD架构，超千万GPU核心

新智元

0+阅读 · 2022年4月4日

给英伟达1.6万亿个晶体管，它就能承托全球互联网流量

大数据文摘

0+阅读 · 2022年3月24日

老黄狂拼CPU！英伟达掏出800亿晶体管显卡，外加世界最快AI超算Eos

THU数据派

0+阅读 · 2022年3月23日

大国重器！全球顶级超算算力排行榜，top500中国占174台

新智元

0+阅读 · 2022年2月3日

Meta为元宇宙建全球最快AI超算，1.6万个A100 GPU，英伟达都赚麻了

量子位

2+阅读 · 2022年1月25日

每秒5百亿亿次！Meta祭出元宇宙巨兽，联手英伟达打造全球最强超算

新智元

0+阅读 · 2022年1月25日

全球首台百亿亿级超算用AMD的GPU：性能增7倍，能效提升3倍

机器之心

0+阅读 · 2021年12月25日

安卓之王来了！世界首款4nm芯天玑9000问世，狂揽10项全球第一

新智元

0+阅读 · 2021年11月19日

用于GEM探测器的高集成度专用集成电路研制

国家自然科学基金

2+阅读 · 2013年12月31日

异构并行计算环境下基于OpenCL的刀具路径规划模式研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于STT-MRAM的三维片上多核系统缓存低功耗设计方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

GPU通用计算系统检查点方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

数字声呐接收机调理电路单芯片设计与噪声优化方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

千核级处理器的高效模拟关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

云计算环境下数据中心的power capping关键问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向高性能计算的高效平台虚拟化关键技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

数万核环境偏微分方程可扩展解法器若干关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

路由器SoC结构与复用技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

OFedQIT: Communication-Efficient Online Federated Learning via Quantization and Intermittent Transmission

Arxiv

0+阅读 · 2022年7月28日

SCALER: A Tough Versatile Quadruped Free-Climber Robot

Arxiv

0+阅读 · 2022年7月27日

Efficient and Scalable Graph Pattern Mining on GPUs

Arxiv

0+阅读 · 2022年7月27日

Performance of an Astrophysical Radiation Hydrodynamics Code under Scalable Vector Extension Optimization

Arxiv

0+阅读 · 2022年7月27日

ParC-Net: Position Aware Circular Convolution with Merits from ConvNets and Transformer

Arxiv

0+阅读 · 2022年7月26日

Sweeter than SUITE: Supermartingale Stratified Union-Intersection Tests of Elections

Arxiv

0+阅读 · 2022年7月25日

EDTER: Edge Detection with Transformer

Arxiv

11+阅读 · 2022年3月16日

L^2-GCN: Layer-Wise and Learned Efficient Training of Graph Convolutional Networks

Arxiv

16+阅读 · 2020年3月30日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Attention Is All You Need

Arxiv

27+阅读 · 2017年12月6日

VIP会员

美国重夺全球超算第一！人类实现百亿亿次E级超算，Frontier屠榜全球Top500

新智元报道

【新智元导读】最新超算Top500榜单揭晓！美国的性能怪兽Frontier以横扫之势拿下第一，算力超过身后468台的总和。

Frontier：突破百亿亿次

中国：玩你们的，我就看看 在新一期榜单上，中国和美国仍然是上榜最多的国家。

欧洲崛起：Top10占据7席 美国并不是唯一取得显著成绩的地区。 欧洲也表现良好，从总排名上看，美、中、日占据前3，前十中剩余的七席则全部为欧洲国家占据。

欧洲崛起：Top10占据7席

为啥不用GPU加速：还是差钱 长 久以来，AMD第一次在Top500中的系统内的主机CPU中占有代表性的份额，但英特尔至强处理器仍然占主导地位。

为啥不用GPU加速：还是差钱

相关内容

中国：玩你们的，我就看看

在新一期榜单上，中国和美国仍然是上榜最多的国家。

欧洲崛起：Top10占据7席

美国并不是唯一取得显著成绩的地区。欧洲也表现良好，从总排名上看，美、中、日占据前3，前十中剩余的七席则全部为欧洲国家占据。

为啥不用GPU加速：还是差钱

长久以来，AMD第一次在Top500中的系统内的主机CPU中占有代表性的份额，但英特尔至强处理器仍然占主导地位。