Most parallel applications suffer from load imbalance, a crucial performance degradation factor. In particle simulations, this is mainly due to the migration of particles between processing elements, which eventually gather unevenly and create workload imbalance. Dynamic load balancing is used at various iterations to mitigate load imbalance, employing a partitioning method to divide the computational space evenly while minimizing communications. In this paper, we propose a novel partitioning methodology called ``informed partitioning''. It uses information based on the evolution of the computation to reduce the load balancing growth and the number of load balancing calls. We illustrate informed partitioning by proposing a new geometric partitioning technique for particles simulations. This technique is derived from the well-known recursive coordinate bisection and employs the velocity of the particles to guide the bisection axis. To properly compare the performance of our new method with existing partitioning techniques during application execution, we introduce an effort metric based on a theoretical model of load balanced parallel application time. We propose a proof-of-concept of informed partitioning, through a numerical study, on three N-Body simulations with various particle dynamics, and we discuss its performance against popular geometric partitioning techniques. Moreover, we show that our effort metric can be used to rank partitioning techniques by their efficiency at any time point during the simulation. Eventually, this could be used to choose the best partitioning on the fly. In the numerical study, we report that our novel concept increases the performance of two experiments out of three by up to 76% and 15%, while being marginally slower by only $3\%$ in one experiment. Also, we discuss the limitations of our implementation of informed partitioning and our effort metric.


翻译:在粒子模拟中,这主要是由于粒子在加工元素之间迁移,最终聚集不均,造成工作量不平衡。在各种迭代中使用了动态负平衡,以缓解负不平衡,使用一种平衡方法来平衡计算空间,同时将通信最小化。在本文中,我们提出一个新的分隔方法,称为“知情分隔 ” 。它使用基于计算演进的信息来减少负负平衡增长和负平衡调用量。我们通过提出一种新的粒子模拟几何分解技术来说明知情的分隔。这一技术来自众所周知的递归协调双剖面,并使用粒子速度来引导两截面轴。为了在应用执行期间适当地将我们的新方法的性能与现有的分隔技术作比较,我们采用了一种基于负平衡平行应用时间的理论模型。我们提出了一种基于信息平衡的分化概念,通过一项数字研究来证明知情的分解,在三次N-Body模拟中提出了粒子模拟,我们讨论其运行情况与普观性分解分流轴轴轴轴之间的速度,我们使用了两种计算方法,我们使用这种效率分析方法来测量分流方法来测量。此外,我们使用任何时间分层分析方法,我们使用这种方法来测量分流法的分解方法,我们用一个分解方法,我们使用一种分级法的分级法的分级法,我们用一个分级法,我们用一个分级法的分级法的分级法,我们用一个分级法,我们用来用来用来用来用来做任何顺序的分级法的分级法的分级法,我们用来测量。

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
【陈天奇】TVM:端到端自动深度学习编译器,244页ppt
专知会员服务
85+阅读 · 2020年5月11日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
149+阅读 · 2019年10月12日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
使用 Keras Tuner 调节超参数
TensorFlow
15+阅读 · 2020年2月6日
计算机类 | PLDI 2020等国际会议信息6条
Call4Papers
3+阅读 · 2019年7月8日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
24+阅读 · 2019年5月22日
大数据 | 顶级SCI期刊专刊/国际会议信息7条
Call4Papers
10+阅读 · 2018年12月29日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
已删除
清华大学研究生教育
3+阅读 · 2018年6月30日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Arxiv
0+阅读 · 2021年9月22日
Arxiv
38+阅读 · 2021年8月31日
VIP会员
相关VIP内容
相关资讯
使用 Keras Tuner 调节超参数
TensorFlow
15+阅读 · 2020年2月6日
计算机类 | PLDI 2020等国际会议信息6条
Call4Papers
3+阅读 · 2019年7月8日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
24+阅读 · 2019年5月22日
大数据 | 顶级SCI期刊专刊/国际会议信息7条
Call4Papers
10+阅读 · 2018年12月29日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
已删除
清华大学研究生教育
3+阅读 · 2018年6月30日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Top
微信扫码咨询专知VIP会员