面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究 - 专知基金

会员服务 ·

1

无网格法 · 并行计算 ·

2014 年 12 月 31 日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

项目编号： No.11472274

项目类型： 面上项目

立项/批准年度： 2015

项目学科： 数理科学和化学

项目作者： 田荣

作者单位： 北京应用物理与计算数学研究所

项目金额： 98万元

中文摘要： 超级计算机浮点运算能力的迅速提高和数据移动能力的缓慢增长已经形成了非常明显的浮点效率鸿沟。浮点效率鸿沟反映了传统数值算法（应用数学学科）与新兴硬件结构（计算机学科）之间发展的不平衡和不匹配。在目前的新兴众核处理器上，一个高效的数值算法应该使单位访存所完成的浮点运算次数最大化，从而尽可能地享受由这一轮技术变革带来的新的免费午餐--超强浮点运算能力。这极可能将导致数值算法设计在思路上、甚至原则上的根本性转变。本项目首次尝试面向新兴计算机体系结构，从充分释放众核处理器冗余计算能力的角度出发，发展一种新的高效且高精度（无额外自由度）的广义有限元方法，并针对无网格/粒子/广义有限元法等一类计算较为密集的数值算法，深入研究这种硬件效能和数值精度双赢的新型计算模式的普适性。

中文关键词： 计算力学；无网格法；广义有限元；并行计算；扩展有限元

英文摘要： The work is motivated by the challenge in fully utilizing high floating point performance of the emerging manycore architecture. A fundamental trend of computer architecture evolving towards exaflop/s (10^18 floating point operations (flops) per second) is the fast increasing floating point performance (so-called free flops) accompanied by much slowly increasing the capability of data movement. Numerical simulation is facing a challenge posed by the unbalanced increase in the compute power and the bandwidth. The tomorrow's numerical simulation is likely to be subject to a bandwidth constraint instead of a performance constraint. A numerical method of PDEs should be designed to request more flops per unit data movement so that the free flops are not sitting idle and wasted. A meshfree method is able to increase arithmetic intensity for the same number of dofs by increasing the influence radius or by increasing the accuracy of approximation and therefore it may bear a potential in utilizing the redundant floating point capability of the emerging manycore processor. This idea will be tried out on a GFEM without extra dof in this project.

英文关键词： Computational Mechanics;Meshfree;GFEM;Parallel Computing;XFEM

成为VIP会员查看完整内容

2

相关内容

无网格法

深度神经网络 FPGA 设计进展、实现与展望

深度神经网络 FPGA 设计进展、实现与展望

专知会员服务

59+阅读 · 2022年3月26日

【博士论文】分形计算系统

【博士论文】分形计算系统

专知会员服务

37+阅读 · 2021年12月9日

面向移动增强现实的实时深度学习目标检测方法综述

专知会员服务

22+阅读 · 2021年10月9日

基于粗粒度数据流架构的稀疏卷积神经网络加速

专知会员服务

23+阅读 · 2021年7月15日

处理器芯片敏捷设计方法：问题与挑战

专知会员服务

19+阅读 · 2021年6月29日

中小学人工智能课程的设计原则与实践范例

中小学人工智能课程的设计原则与实践范例

专知会员服务

25+阅读 · 2021年4月22日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【硬核书】矩阵代数:统计学的理论、计算和应用，664页pdf

【硬核书】矩阵代数:统计学的理论、计算和应用，664页pdf

专知会员服务

181+阅读 · 2021年1月30日

【博士论文】解耦合的类脑计算系统栈设计

【博士论文】解耦合的类脑计算系统栈设计

专知会员服务

32+阅读 · 2020年12月14日

【CCF优秀博士学位论文奖-2019】大规模图数据处理系统的设计与实现，清华大学朱晓伟

【CCF优秀博士学位论文奖-2019】大规模图数据处理系统的设计与实现，清华大学朱晓伟

专知会员服务

51+阅读 · 2019年11月8日

ISSCC 2022 | 兼顾能效、精度和灵活性，可重构数字存算一体架构打开高算力AI芯片新范式

ISSCC 2022 | 兼顾能效、精度和灵活性，可重构数字存算一体架构打开高算力AI芯片新范式

机器之心

1+阅读 · 2022年4月15日

物理系统执行机器学习计算，一种使用反向传播训练的深度物理神经网络

物理系统执行机器学习计算，一种使用反向传播训练的深度物理神经网络

机器之心

1+阅读 · 2022年1月30日

CUDA高性能计算经典问题：归约

CUDA高性能计算经典问题：归约

极市平台

1+阅读 · 2022年1月13日

【NeurIPS'21】使用典型相关分析轻松高效地实现大图上的自监督表示学习

【NeurIPS'21】使用典型相关分析轻松高效地实现大图上的自监督表示学习

图与推荐

0+阅读 · 2022年1月3日

NeurIPS'21 | 面向开放世界特征的图学习

NeurIPS'21 | 面向开放世界特征的图学习

图与推荐

2+阅读 · 2021年12月18日

【博士论文】分形计算系统

【博士论文】分形计算系统

专知

3+阅读 · 2021年12月9日

【博士论文】基于冲量的加速优化算法

【博士论文】基于冲量的加速优化算法

专知

7+阅读 · 2021年11月29日

函数计算GB镜像秒级启动：下一代软硬件架构协同优化揭秘

函数计算GB镜像秒级启动：下一代软硬件架构协同优化揭秘

阿里技术

0+阅读 · 2021年11月15日

第四范式OpenMLDB: 拓展Spark源码实现高性能Join

第四范式OpenMLDB: 拓展Spark源码实现高性能Join

AI前线

0+阅读 · 2021年9月19日

面向云端融合的分布式计算技术研究进展与趋势

面向云端融合的分布式计算技术研究进展与趋势

中国计算机学会

19+阅读 · 2018年11月27日

面向浅水波大气动力方程求解器的可重构计算方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

面向数万处理器的有限元线性方程组与模态多级算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

众核集群上基于MPI的模型扩展及性能优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的计算与存储融合CPU体系结构研究

国家自然科学基金

0+阅读 · 2014年12月31日

低复杂度极小误差数值算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向异构众核系统的非规则问题优化技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向通用计算集群的全局GPU虚拟化理论与方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

Steklov特征值问题的高效数值计算方法

国家自然科学基金

0+阅读 · 2012年12月31日

异构多核平台上基于软件分布式共享内存的编程模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向多核异构平台的协同设计虚拟机关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

Estimating Software Reliability Using Size-biased Modelling

Arxiv

0+阅读 · 2022年4月20日

Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning

Arxiv

1+阅读 · 2022年4月20日

Introduction to Semi-discrete Calculus

Arxiv

1+阅读 · 2022年4月19日

Limitations of Deep Learning for Inverse Problems on Digital Hardware

Arxiv

0+阅读 · 2022年4月19日

CenterNet++ for Object Detection

Arxiv

0+阅读 · 2022年4月18日

Polynomial-time sparse measure recovery

Arxiv

0+阅读 · 2022年4月16日

MetaCURE: Meta Reinforcement Learning with Empowerment-Driven Exploration

Arxiv

12+阅读 · 2021年2月7日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources

Arxiv

13+阅读 · 2019年11月14日

Automatically Designing CNN Architectures for Medical Image Segmentation

Automatically Designing CNN Architectures for Medical Image Segmentation

Arxiv

10+阅读 · 2018年7月19日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

热门VIP内容

开通专知VIP会员享更多权益服务

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

相关VIP内容

深度神经网络 FPGA 设计进展、实现与展望

深度神经网络 FPGA 设计进展、实现与展望

专知会员服务

59+阅读 · 2022年3月26日

【博士论文】分形计算系统

【博士论文】分形计算系统

专知会员服务

37+阅读 · 2021年12月9日

面向移动增强现实的实时深度学习目标检测方法综述

专知会员服务

22+阅读 · 2021年10月9日

基于粗粒度数据流架构的稀疏卷积神经网络加速

专知会员服务

23+阅读 · 2021年7月15日

处理器芯片敏捷设计方法：问题与挑战

专知会员服务

19+阅读 · 2021年6月29日

中小学人工智能课程的设计原则与实践范例

中小学人工智能课程的设计原则与实践范例

专知会员服务

25+阅读 · 2021年4月22日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【硬核书】矩阵代数:统计学的理论、计算和应用，664页pdf

【硬核书】矩阵代数:统计学的理论、计算和应用，664页pdf

专知会员服务

181+阅读 · 2021年1月30日

【博士论文】解耦合的类脑计算系统栈设计

【博士论文】解耦合的类脑计算系统栈设计

专知会员服务

32+阅读 · 2020年12月14日

【CCF优秀博士学位论文奖-2019】大规模图数据处理系统的设计与实现，清华大学朱晓伟

【CCF优秀博士学位论文奖-2019】大规模图数据处理系统的设计与实现，清华大学朱晓伟

专知会员服务

51+阅读 · 2019年11月8日

相关资讯

ISSCC 2022 | 兼顾能效、精度和灵活性，可重构数字存算一体架构打开高算力AI芯片新范式

ISSCC 2022 | 兼顾能效、精度和灵活性，可重构数字存算一体架构打开高算力AI芯片新范式

机器之心

1+阅读 · 2022年4月15日

物理系统执行机器学习计算，一种使用反向传播训练的深度物理神经网络

物理系统执行机器学习计算，一种使用反向传播训练的深度物理神经网络

机器之心

1+阅读 · 2022年1月30日

CUDA高性能计算经典问题：归约

CUDA高性能计算经典问题：归约

极市平台

1+阅读 · 2022年1月13日

【NeurIPS'21】使用典型相关分析轻松高效地实现大图上的自监督表示学习

【NeurIPS'21】使用典型相关分析轻松高效地实现大图上的自监督表示学习

图与推荐

0+阅读 · 2022年1月3日

NeurIPS'21 | 面向开放世界特征的图学习

NeurIPS'21 | 面向开放世界特征的图学习

图与推荐

2+阅读 · 2021年12月18日

【博士论文】分形计算系统

【博士论文】分形计算系统

专知

3+阅读 · 2021年12月9日

【博士论文】基于冲量的加速优化算法

【博士论文】基于冲量的加速优化算法

专知

7+阅读 · 2021年11月29日

函数计算GB镜像秒级启动：下一代软硬件架构协同优化揭秘

函数计算GB镜像秒级启动：下一代软硬件架构协同优化揭秘

阿里技术

0+阅读 · 2021年11月15日

第四范式OpenMLDB: 拓展Spark源码实现高性能Join

第四范式OpenMLDB: 拓展Spark源码实现高性能Join

AI前线

0+阅读 · 2021年9月19日

面向云端融合的分布式计算技术研究进展与趋势

面向云端融合的分布式计算技术研究进展与趋势

中国计算机学会

19+阅读 · 2018年11月27日

相关基金

面向浅水波大气动力方程求解器的可重构计算方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

面向数万处理器的有限元线性方程组与模态多级算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

众核集群上基于MPI的模型扩展及性能优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的计算与存储融合CPU体系结构研究

国家自然科学基金

0+阅读 · 2014年12月31日

低复杂度极小误差数值算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向异构众核系统的非规则问题优化技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向通用计算集群的全局GPU虚拟化理论与方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

Steklov特征值问题的高效数值计算方法

国家自然科学基金

0+阅读 · 2012年12月31日

异构多核平台上基于软件分布式共享内存的编程模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向多核异构平台的协同设计虚拟机关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

相关论文

Estimating Software Reliability Using Size-biased Modelling

Arxiv

0+阅读 · 2022年4月20日

Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning

Arxiv

1+阅读 · 2022年4月20日

Introduction to Semi-discrete Calculus

Arxiv

1+阅读 · 2022年4月19日

Limitations of Deep Learning for Inverse Problems on Digital Hardware

Arxiv

0+阅读 · 2022年4月19日

CenterNet++ for Object Detection

Arxiv

0+阅读 · 2022年4月18日

Polynomial-time sparse measure recovery

Arxiv

0+阅读 · 2022年4月16日

MetaCURE: Meta Reinforcement Learning with Empowerment-Driven Exploration

Arxiv

12+阅读 · 2021年2月7日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources

Arxiv

13+阅读 · 2019年11月14日

Automatically Designing CNN Architectures for Medical Image Segmentation

Automatically Designing CNN Architectures for Medical Image Segmentation

Arxiv

10+阅读 · 2018年7月19日

微信扫码咨询专知VIP会员