高性能计算(HPC)系统比以往任何时候都更为强大。然而,性能的提升也带来了更大的复杂性,给希望利用这些系统进行科学研究的研究人员带来了重大挑战。本篇博士论文探讨了面向科学计算的可扩展编程解决方案的发展。这些解决方案旨在跨多种计算平台有效运行,从个人桌面到先进的超级计算机都包括在内。

为了更好地理解高性能计算系统,本论文首先回顾了关于百亿亿次(Exascale)超级计算机的文献,这些强大的系统能够每秒执行10¹⁸次浮点运算。这项回顾结合了手工分析和数据驱动分析,揭示了虽然百亿亿次计算的传统挑战已在很大程度上得到解决,但软件复杂性和数据量的问题仍然存在。此外,论文介绍了为本研究开发的开源软件工具(名为LitStudy)。

接下来,本论文引入了两个新颖的编程系统。第一个系统(名为Rocket)旨在将全对全算法扩展到大规模数据集。它具有多级软件缓存、分治法、层次化工作窃取以及异步处理,以最大化数据重用、利用数据局部性、动态平衡工作负载,并优化资源利用。第二个系统(名为Lightning)旨在将现有单GPU内核函数扩展到多个GPU上,甚至跨节点,且只需最小的代码调整。在多达32个GPU的八个基准测试中,显示出了优秀的可扩展性。

论文最后提出了一套面向可扩展科学计算的并行编程系统开发的设计原则。这些基于本博士研究经验的原则,代表了使研究人员能够高效利用高性能计算系统方面的重大进展。

成为VIP会员查看完整内容
23

相关内容

【博士论文】基于信息论的泛化理论方法,274页pdf
专知会员服务
54+阅读 · 2024年6月3日
【博士论文】信息论视角下的泛化理论方法,274页pdf
专知会员服务
50+阅读 · 2024年4月28日
【MIT博士论文】垂直领域生成式模型,107页pdf
专知会员服务
67+阅读 · 2023年11月13日
【MIT博士论文】高效可靠深度学习的共形方法,213页pdf
专知会员服务
41+阅读 · 2023年11月12日
【MIT博士论文】多模态:模型、算法与应用,196页pdf
专知会员服务
114+阅读 · 2023年8月17日
【MIT博士论文】控制神经语言生成,147页pdf
专知会员服务
22+阅读 · 2022年9月2日
【2022新书】深度学习归一化技术,117页pdf
专知
26+阅读 · 2022年11月25日
深度多模态表示学习综述论文,22页pdf
专知
31+阅读 · 2020年6月21日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Arxiv
164+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
429+阅读 · 2023年3月31日
Arxiv
71+阅读 · 2023年3月26日
Arxiv
157+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员