项目名称: 异构GPU集群混合粒度任务协同调度与动态均衡机制研究

项目编号: No.61202005

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 李涛

作者单位: 南开大学

项目金额: 22万元

中文摘要: GPU集群计算技术是目前国内外高性能计算研究的热点,对生物、金融、气象等需要进行大规模数据处理的领域具有重要意义。虽然通用并行计算架构如CUDA能够有效地发挥GPU的计算能力,但这些加速(协)处理器的使用带来了新的通信和存储等问题,使GPU集群整体的计算能力难以得到高效利用。本课题从计算、通信和存储三方面考虑与性能相关的体系结构因素,建立适用于异构GPU集群的性能模型;通过分析GPU集群上典型应用的计算模式,提出面向异构GPU集群的混合粒度任务模型,在此基础上实现任务协同调度与动态均衡机制;基于分布式数据管理机制和高效通信机制实现支持多种调度策略的高性能计算框架,并采用大规模计算问题进行效能测试与调优。课题针对GPU带来的新结构特征和编程模型,从提高异构GPU集群计算效能角度提出混合粒度任务调度与动态均衡机制,为异构GPU集群大规模计算研究和应用提供新思路和方法。

中文关键词: GPU集群;混合粒度;协同调度;动态均衡;CUDA

英文摘要: GPU cluster computing technology is a research hotspot in the community of high performance computing nowadays. It is playing an important role in biology, finance, meteorology and any other areas which need large-scale data processing. Although the general parallel computing architecture such as CUDA can effectively exert the computing power of GPUs, the usage of these accelerators also brings new problems, such as CPU-GPU and GPU-GPU communication, data storage, and so on. The whole computing power of GPU cluster cannot be used efficiently. The project builds a performance model suitable for the GPU clusters from three aspects: computation, communication and data storage, regarding the architecture factors that affect performance. Then, the project proposes a hybrid-grained task model for the heterogenous GPU clusters by analyzing the computing model of typical applications executed on GPU clusters, including the concurrency in and between threads and the CPU-GPU cooperation mechanism. The porject also proposes the co-scheduling and dynamic load balancing mechanisms based on the task model. In the end, the project implements a high performance computing framework to support multiple scheduling strategies, which are based on the distributed data management and highly efficient communication. Its performance is

英文关键词: GPU cluster;hybrid-grained;co-scheduling;dynamic balancing;CUDA

成为VIP会员查看完整内容
1

相关内容

图神经网络综述
专知会员服务
193+阅读 · 2022年1月9日
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
【博士论文】集群系统中的网络流调度
专知会员服务
37+阅读 · 2021年12月7日
专知会员服务
62+阅读 · 2021年7月25日
专知会员服务
36+阅读 · 2021年7月8日
专知会员服务
80+阅读 · 2020年12月11日
深度学习模型终端环境自适应方法研究
专知会员服务
31+阅读 · 2020年11月13日
「图神经网络东」最新2022综述
专知
9+阅读 · 2022年1月9日
【博士论文】分形计算系统
专知
2+阅读 · 2021年12月9日
【博士论文】集群系统中的网络流调度
专知
3+阅读 · 2021年12月7日
【边缘计算】边缘计算面临的问题
产业智能官
17+阅读 · 2019年5月31日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
无人机集群对抗研究的关键问题
无人机
49+阅读 · 2018年9月16日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月20日
Disturbance of questionable publishing to academia
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
27+阅读 · 2021年2月17日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Self-Attention Graph Pooling
Arxiv
13+阅读 · 2019年6月13日
小贴士
相关VIP内容
图神经网络综述
专知会员服务
193+阅读 · 2022年1月9日
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
【博士论文】集群系统中的网络流调度
专知会员服务
37+阅读 · 2021年12月7日
专知会员服务
62+阅读 · 2021年7月25日
专知会员服务
36+阅读 · 2021年7月8日
专知会员服务
80+阅读 · 2020年12月11日
深度学习模型终端环境自适应方法研究
专知会员服务
31+阅读 · 2020年11月13日
相关资讯
「图神经网络东」最新2022综述
专知
9+阅读 · 2022年1月9日
【博士论文】分形计算系统
专知
2+阅读 · 2021年12月9日
【博士论文】集群系统中的网络流调度
专知
3+阅读 · 2021年12月7日
【边缘计算】边缘计算面临的问题
产业智能官
17+阅读 · 2019年5月31日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
无人机集群对抗研究的关键问题
无人机
49+阅读 · 2018年9月16日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Disturbance of questionable publishing to academia
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
27+阅读 · 2021年2月17日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Self-Attention Graph Pooling
Arxiv
13+阅读 · 2019年6月13日
微信扫码咨询专知VIP会员