项目名称: 面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

项目编号: No.11472274

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 数理科学和化学

项目作者: 田荣

作者单位: 北京应用物理与计算数学研究所

项目金额: 98万元

中文摘要: 超级计算机浮点运算能力的迅速提高和数据移动能力的缓慢增长已经形成了非常明显的浮点效率鸿沟。浮点效率鸿沟反映了传统数值算法(应用数学学科)与新兴硬件结构(计算机学科)之间发展的不平衡和不匹配。在目前的新兴众核处理器上,一个高效的数值算法应该使单位访存所完成的浮点运算次数最大化,从而尽可能地享受由这一轮技术变革带来的新的免费午餐--超强浮点运算能力。这极可能将导致数值算法设计在思路上、甚至原则上的根本性转变。本项目首次尝试面向新兴计算机体系结构,从充分释放众核处理器冗余计算能力的角度出发,发展一种新的高效且高精度(无额外自由度)的广义有限元方法,并针对无网格/粒子/广义有限元法等一类计算较为密集的数值算法,深入研究这种硬件效能和数值精度双赢的新型计算模式的普适性。

中文关键词: 计算力学;无网格法;广义有限元;并行计算;扩展有限元

英文摘要: The work is motivated by the challenge in fully utilizing high floating point performance of the emerging manycore architecture. A fundamental trend of computer architecture evolving towards exaflop/s (10^18 floating point operations (flops) per second) is the fast increasing floating point performance (so-called free flops) accompanied by much slowly increasing the capability of data movement. Numerical simulation is facing a challenge posed by the unbalanced increase in the compute power and the bandwidth. The tomorrow's numerical simulation is likely to be subject to a bandwidth constraint instead of a performance constraint. A numerical method of PDEs should be designed to request more flops per unit data movement so that the free flops are not sitting idle and wasted. A meshfree method is able to increase arithmetic intensity for the same number of dofs by increasing the influence radius or by increasing the accuracy of approximation and therefore it may bear a potential in utilizing the redundant floating point capability of the emerging manycore processor. This idea will be tried out on a GFEM without extra dof in this project.

英文关键词: Computational Mechanics;Meshfree;GFEM;Parallel Computing;XFEM

成为VIP会员查看完整内容
2

相关内容

深度神经网络 FPGA 设计进展、实现与展望
专知会员服务
57+阅读 · 2022年3月26日
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
专知会员服务
18+阅读 · 2021年10月9日
专知会员服务
22+阅读 · 2021年7月15日
专知会员服务
18+阅读 · 2021年6月29日
中小学人工智能课程的设计原则与实践范例
专知会员服务
24+阅读 · 2021年4月22日
专知会员服务
20+阅读 · 2021年3月9日
【硬核书】矩阵代数:统计学的理论、计算和应用,664页pdf
【博士论文】解耦合的类脑计算系统栈设计
专知会员服务
29+阅读 · 2020年12月14日
CUDA高性能计算经典问题:归约
极市平台
1+阅读 · 2022年1月13日
NeurIPS'21 | 面向开放世界特征的图学习
图与推荐
2+阅读 · 2021年12月18日
【博士论文】分形计算系统
专知
2+阅读 · 2021年12月9日
【博士论文】基于冲量的加速优化算法
专知
7+阅读 · 2021年11月29日
第四范式OpenMLDB: 拓展Spark源码实现高性能Join
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
Arxiv
1+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
0+阅读 · 2022年4月16日
小贴士
相关VIP内容
深度神经网络 FPGA 设计进展、实现与展望
专知会员服务
57+阅读 · 2022年3月26日
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
专知会员服务
18+阅读 · 2021年10月9日
专知会员服务
22+阅读 · 2021年7月15日
专知会员服务
18+阅读 · 2021年6月29日
中小学人工智能课程的设计原则与实践范例
专知会员服务
24+阅读 · 2021年4月22日
专知会员服务
20+阅读 · 2021年3月9日
【硬核书】矩阵代数:统计学的理论、计算和应用,664页pdf
【博士论文】解耦合的类脑计算系统栈设计
专知会员服务
29+阅读 · 2020年12月14日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员