Executing scientific workflows with heterogeneous tasks on HPC platforms poses several challenges which will be further exacerbated by the upcoming exascale platforms. At that scale, bespoke solutions will not enable effective and efficient workflow executions. In preparation, we need to look at ways to manage engineering effort and capability duplication across software systems by integrating independently developed, production-grade software solutions. In this paper, we integrate RADICAL-Pilot (RP) and Parsl and develop an MPI executor to enable the execution of workflows with heterogeneous (non)MPI Python functions at scale. We characterize the strong and weak scaling of the integrated RP-Parsl system when executing two use cases from polar science, and of the function executor on both SDSC Comet and TACC Frontera. We gain engineering insight about how to analyze and integrate workflow and runtime systems, minimizing changes in their code bases and overall development effort. Our experiments show that the overheads of the integrated system are invariant of resource and workflow scale, and measure the impact of diverse MPI overheads. Together, those results define a blueprint towards an ecosystem populated by specialized, efficient, effective and independently-maintained software systems to face the upcoming scaling challenges.


翻译:执行具有不同任务的科学工作流程,HPC平台上的各种任务将面临若干挑战,这些挑战将因即将到来的扩展平台而进一步加剧。在这个规模上,简单的解决方案将无法促成有效和高效的工作流程执行。在准备过程中,我们需要研究如何通过整合独立开发的、生产级的软件解决方案来管理软件系统之间的工程努力和能力重复。在本文件中,我们整合了RADC-Pilot(RP)和Parsl(RAD-Pilot)和Parsl(Parsl),并开发了MPI执行器,以便能够执行具有不同(non)MPI Python功能的大规模工作流程。我们在实施极地科学的两个使用案例时,以及SDSC Compt和TACC Fronterera两个功能执行器的功能执行器时,我们特征是强而薄弱的。我们从工程角度深入了解如何分析和整合工作流程和运行时间系统,尽量减少其代码基础和总体开发工作的变化。我们的实验表明,综合系统的管理器在资源和工作流程规模上是变化不定的,并衡量多种MPI管理器的影响。这些结果共同界定了通过专业化、高效、有效和独立软件逐步提升生态系统所面临的挑战。

0
下载
关闭预览

相关内容

Integration:Integration, the VLSI Journal。 Explanation:集成,VLSI杂志。 Publisher:Elsevier。 SIT:http://dblp.uni-trier.de/db/journals/integration/
专知会员服务
14+阅读 · 2021年5月21日
专知会员服务
17+阅读 · 2020年9月6日
注意力图神经网络的小样本学习
专知会员服务
191+阅读 · 2020年7月16日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
151+阅读 · 2019年10月12日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
ICLR2019最佳论文出炉
专知
12+阅读 · 2019年5月6日
计算机 | CCF推荐期刊专刊信息5条
Call4Papers
3+阅读 · 2019年4月10日
机器学习可解释性工具箱XAI
专知
11+阅读 · 2019年2月8日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
spinningup.openai 强化学习资源完整
CreateAMind
6+阅读 · 2018年12月17日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
已删除
将门创投
4+阅读 · 2018年6月26日
在Python中使用SpaCy进行文本分类
专知
24+阅读 · 2018年5月8日
【推荐】基于TVM工具链的深度学习编译器 NNVM compiler发布
机器学习研究会
5+阅读 · 2017年10月7日
The Cost of Simple Bidding in Combinatorial Auctions
Arxiv
0+阅读 · 2021年7月16日
Clustering of heterogeneous populations of networks
Arxiv
0+阅读 · 2021年7月15日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Semantics of Data Mining Services in Cloud Computing
Arxiv
4+阅读 · 2018年10月5日
VIP会员
相关VIP内容
专知会员服务
14+阅读 · 2021年5月21日
专知会员服务
17+阅读 · 2020年9月6日
注意力图神经网络的小样本学习
专知会员服务
191+阅读 · 2020年7月16日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
151+阅读 · 2019年10月12日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
ICLR2019最佳论文出炉
专知
12+阅读 · 2019年5月6日
计算机 | CCF推荐期刊专刊信息5条
Call4Papers
3+阅读 · 2019年4月10日
机器学习可解释性工具箱XAI
专知
11+阅读 · 2019年2月8日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
spinningup.openai 强化学习资源完整
CreateAMind
6+阅读 · 2018年12月17日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
已删除
将门创投
4+阅读 · 2018年6月26日
在Python中使用SpaCy进行文本分类
专知
24+阅读 · 2018年5月8日
【推荐】基于TVM工具链的深度学习编译器 NNVM compiler发布
机器学习研究会
5+阅读 · 2017年10月7日
Top
微信扫码咨询专知VIP会员