项目名称: 大型异构系统上数百万核可扩展的新型区域分裂隐式求解器研究

项目编号: No.91530103

项目类型: 重大研究计划

立项/批准年度: 2016

项目学科: 数理科学和化学

项目作者: 杨超

作者单位: 中国科学院软件研究所

项目金额: 42万元

中文摘要: 以天河、神威、星云等为代表的异构、众核系统已成为重要趋势,对应的高可扩展偏微分方程隐式求解算法和软件已成为亟待突破的一大瓶颈。鉴此,上期培育项目:(1)提出了面向显式模拟的新型区域分裂方法,在天河1A、天河2等平台进行了十万及百万核级的大规模实算;(2)初步探索了其在隐式求解中的可行性,成功用于HPCG新型基准测试的算法设计和优化,在天河2上扩展至整机312万核并取得国际HPCG排行榜榜首。本项目拟延续、凝练、升华前期成果,充分考虑大型异构系统的发展趋势及以地学计算为代表的重点应用领域的问题特征,进一步深入研究基于异构区域分裂框架的隐式求解方法,并结合相应的线性、非线性系统并行求解算法及自适应负载均衡、多级通信优化和多粒度性能调优技术,寻求收敛性、并行性、体系结构友好性之间的平衡,形成一套高效的异构并行隐式求解算法库,并在国产顶级大型异构系统上实现数百、上千万核的高可扩展计算。

中文关键词: 异构计算;偏微分方程求解器;隐式算法;区域分裂;

英文摘要: Many-core heterogeneous supercomputing systems, such as the Tianhe, Shenwei and Nebula series, have become an important trend in high performance computing. However, many traditional implicit algorithms for solving partial differential equation are no longer suitable or even completely inapplicable on such kind of systems. It is therefore of great importance to develop heterogeneity-friendly parallel algorithms and software. To that end, under the support of the previous NFSC grant, we proposed a new class of heterogeneous domain decomposition methods for the explicit solution of partial differential equations and scaled to O(100,000) and O(1,000,000) cores on the CPU-GPU-based Tianhe-1A and the CPU-MIC-based Tianhe-2, respectively. In addition, an attempt was done by applying the heterogeneous domain decomposition methods in a typical fully implicit solver in the new HPCG benchmark, which successfully led to a full system scale, top 1 HPCG performance on Tianhe-2 with 3.12 million cores. Based on the previous work, we plan to continue, concise, and sublimate the research, by focusing on the trends and characteristics of heterogeneous systems and the key characteristics of typical geo-scientific applications, in order to further study fully implicit domain decomposition methods on heterogeneous systems. In the p

英文关键词: Heterogeneous computing;PDE solver;Implicit algorithm;Domain decomposition;

成为VIP会员查看完整内容
0

相关内容

中国信通院《新型智慧城市产业图谱研究报告》
专知会员服务
30+阅读 · 2022年3月9日
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
FPGA加速深度学习综述
专知会员服务
66+阅读 · 2021年11月13日
【NeurIPS 2021】基于潜在空间能量模型的可控和组分生成
专知会员服务
15+阅读 · 2021年10月23日
专知会员服务
64+阅读 · 2021年1月28日
【IJCAI】大规模可扩展深度学习,82页ppt
专知会员服务
26+阅读 · 2021年1月10日
【博士论文】解耦合的类脑计算系统栈设计
专知会员服务
29+阅读 · 2020年12月14日
【ECAI2020】可扩展深度学习: 理论与算法,120页ppt
专知会员服务
27+阅读 · 2020年9月25日
【博士论文】分形计算系统
专知
2+阅读 · 2021年12月9日
NIPS'21 | 通过动态图评分匹配预测分子构象
图与推荐
0+阅读 · 2021年11月29日
借助新的物理模拟引擎加速强化学习
TensorFlow
1+阅读 · 2021年8月16日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
10+阅读 · 2018年4月19日
小贴士
相关主题
相关VIP内容
中国信通院《新型智慧城市产业图谱研究报告》
专知会员服务
30+阅读 · 2022年3月9日
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
FPGA加速深度学习综述
专知会员服务
66+阅读 · 2021年11月13日
【NeurIPS 2021】基于潜在空间能量模型的可控和组分生成
专知会员服务
15+阅读 · 2021年10月23日
专知会员服务
64+阅读 · 2021年1月28日
【IJCAI】大规模可扩展深度学习,82页ppt
专知会员服务
26+阅读 · 2021年1月10日
【博士论文】解耦合的类脑计算系统栈设计
专知会员服务
29+阅读 · 2020年12月14日
【ECAI2020】可扩展深度学习: 理论与算法,120页ppt
专知会员服务
27+阅读 · 2020年9月25日
相关资讯
【博士论文】分形计算系统
专知
2+阅读 · 2021年12月9日
NIPS'21 | 通过动态图评分匹配预测分子构象
图与推荐
0+阅读 · 2021年11月29日
借助新的物理模拟引擎加速强化学习
TensorFlow
1+阅读 · 2021年8月16日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员