In this paper, we describe a numerical algorithm for the self-consistent simulations of surface water and sediment dynamics. The method is based on the original Lagrangian-Eulerian CSPH-TVD approach for solving the Saint-Venant and Exner equations, taking into account the physical factors essential for the understanding of the shallow water and surface soil layer motions, including complex terrain structure and its evolution due to sediment transport. Additional Exner equation for sediment transport has been used for the numerical CSPH-TVD scheme stability criteria definition. By using OpenMP-CUDA and GPUDirect technologies for hybrid computing systems (supercomputers) with several graphic coprocessors (GPUs) interacting with each other via the PCI-E / NVLINK interface we also develop a parallel numerical algorithm for the CSPH-TVD method. The developed parallel version of the algorithm demonstrates high efficiency for various configurations of Nvidia Tesla CPU + GPU computing systems. In particular, maximal speed up is 1800 for a system with four C2070 GPUs compare to the serial version for the CPU. The calculation time on the GPU V100~(Volta architecture) is reduced by 95 times compared to the GPU C2070~(Fermi architecture).


翻译:在本文中,我们描述地表水和沉积物动态自我一致模拟的数值算法,该方法以最初的Lagrangian-Eulerian CSPH-TVD 方法为基础,解决Saint-Venant和Exner等式,同时考虑到对了解浅水和地表土壤层运动至关重要的物质因素,包括复杂的地形结构及其因沉积物迁移而演化。在数字的 CSPH-TVD 系统稳定性标准定义中,还使用了沉积物运输的额外Exner等式。特别是,使用OpenMP-CUDA和GPUDirect技术,用于混合计算机系统(超级计算机)和若干图形共处理器(GPUS),通过PCI-E/NVLINK接口相互互动,我们还为CSPH-TVD方法开发了平行的数字算法。所开发的平行算法显示,Nvidia Tesla CPU + GPU计算系统的各种配置效率很高。特别是,使用4个 C2070GPU(C-70GPU)的系统的最大速度为1800,与序列结构比较的C-VPUI-100,比GPI的C的C-VLU的C-100时间结构的计算方法减少了。

0
下载
关闭预览

相关内容

Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
经济学中的数据科学,Data Science in Economics,附22页pdf
专知会员服务
35+阅读 · 2020年4月1日
专知会员服务
60+阅读 · 2020年3月19日
计算机类 | PLDI 2020等国际会议信息6条
Call4Papers
3+阅读 · 2019年7月8日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
计算机类 | 11月截稿会议信息9条
Call4Papers
6+阅读 · 2018年10月14日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
【今日新增】IEEE Trans.专刊截稿信息8条
Call4Papers
7+阅读 · 2017年6月29日
Arxiv
0+阅读 · 2021年5月25日
Arxiv
1+阅读 · 2021年5月24日
Arxiv
0+阅读 · 2021年5月22日
VIP会员
相关资讯
计算机类 | PLDI 2020等国际会议信息6条
Call4Papers
3+阅读 · 2019年7月8日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
计算机类 | 11月截稿会议信息9条
Call4Papers
6+阅读 · 2018年10月14日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
【今日新增】IEEE Trans.专刊截稿信息8条
Call4Papers
7+阅读 · 2017年6月29日
Top
微信扫码咨询专知VIP会员