作为目前世界上运行速度最快的超级计算机,Summit在距其初次亮相数周后就已经凭借其迅猛的性能为各个科研领域提供了强力支持。从超导体到成瘾性机制的研究,Summit的出现对于科学领域研究成果的突破起到了至关重要的作用。
Summit位于美国田纳西州橡树岭国家实验室 (ORNL),目前已开始为 CoMet(可识别出与疾病相关联的基因模式的应用程序)提供运行支持,其运行速度要比上一代产品Titan快150倍。另一款运行于其上的应用程序是QMCPACK,该应用可处理量子蒙特卡罗模拟,以探索新一代超导体等新型材料。这一过程的运行速度要比Titan快50倍。
Summit之所以能够为应用广泛的科研领域提供加速,要归功于NVIDIA十多年来对“堆栈”技术的全方位投资,其中涉及到GPU并行处理器的架构改进、系统设计、软件、算法和应用程序优化等方方面面。在整个堆栈领域范围内进行创新并不容易,但却异常重要,因为随着摩尔定律的失效,性能提升将不会再轻易自动实现。
Summit由27648块NVIDIA GPU提供支持,是为加速各类科学研究而打造的最新款GPU驱动型超级计算机。这台计算机专为美国能源部的项目打造,是全球第一台每秒可完成超过100petaflops的超级计算机,能够加速世界顶尖科学家在高能物理学、材料发现、医疗等各个领域的科研进步。
但Summit的优胜之处并不仅在于速度。与Titan每个节点运行一块GPU的布局不同,Summit在每个节点都搭载了6块Tensor Core GPU。这使得Summit在得以灵活运行传统模拟的同时,还能适用于GPU深度学习。自从六年前推出Titan以来,深度学习已经颠覆了整个计算世界的格局。
Volta如何奠定基石
有了Volta,我们得以重塑GPU。其革命性的Tensor Core架构使得多精度计算成为可能。因此可以在半精度(FP16)下达到每秒125万亿次的浮点运算速度。而如果需要执行更大范围或更高精度的计算(如进行科学模拟),也同样能够以单精度(FP32)和双精度(FP64)运行。
Volta融合了深度学习所需的高效处理能力和科学模拟所需的高精度计算能力,是AI和高性能计算的强劲计算动力之源。
借助NVIDIA的全栈优化方法,在诸如Summit的基于Volta的系统上,研究人员得以加快其原始运行速度。从而让我们能够以更快的速度找到应对重大挑战的解决方案。在一开始就有机会使用Summit的研究人员,已经在基因组和材料科学等研究中证明了这一方法的优势,从而有希望为现实世界带来真正的益处。
解开遗传之谜
基因决定了我们容易患上哪些疾病和症状。阿尔茨海默病等疾病或慢性疼痛等症状可能引发阿片类药物成瘾的现象,但只有10%的阿片类处方药物可能会导致上瘾。
人类基因组由30亿个核苷酸组成,需要进行大量计算才能全面了解各种基因组合,以及导致慢性疼痛或阿片类药物成瘾的基因组合。这种可能的基因组合数量甚至比宇宙中的原子数量还要多。
Summit在每个节点上都采用了6块V100 Tensor Core GPU,可提供高于Titan 150倍的性能,并能够完成之前不可能实现的基因模式探索。这为在一系列疾病方面实现医学突破铺平了道路,如心脏病、癌症、阿尔茨海默病以及阿片类药物成瘾症。
释放超导之力
超导体是迄今为止被发现的最令人激动的材料之一。它能够在没有任何能量损失的情况下传输电力,还可以用于永久性储存能量。可以将其用于开发MRI(核磁共振成像)设备、磁悬浮列车以及磁聚变装置等的强大科学磁体。
但面临的一个主要挑战是:超导体只能在极低温度(-243℃)下工作,而创造这一温度条件的造价不菲,例如使用液氦。
高温超导体(HTS)只需在-70℃下工作,但它易碎且难以生产。量子蒙特卡罗 (QMC) 电子结构计算可以帮助识别具有金属性质的新型HTS材料。
研究人员对QMCPACK进行了优化以使其适合在Summit的Volta GPU上运行,且其在Summit节点上的运算速度比Titan要高出50倍。这让研究人员得以大幅提升可模拟材料的复杂度,同时极大地加快了对于经济实惠的新型超导体的发掘历程。
AI和模拟:强强联合
Summit极好地诠释了当前超级计算机和机器类型的转变潮流:既有极快的运行速度,可以加速科学模拟,同时又足够智能,可以从海量数据中获得洞察。
这一强强联合,有希望助力当代科学家们创造研究奇迹。借助Summit及类似系统,我们将竭尽全力确保它们不负众望。