项目名称: 异构多核平台上基于软件分布式共享内存的编程模型研究

项目编号: No.61202049

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 李波

作者单位: 浙江工业大学

项目金额: 23万元

中文摘要: 异构多核是由架构不同的核心组成的计算平台,由于其能够在特定的领域中针对应用的特点充分发挥不同处理器核的作用,成为了高性能计算平台主流架构和硬件基础。但也由于其不同架构组合复杂多样,传统的单一消息或者共享的编程模型都难以清晰描述各个计算部件之间的协同关系,导致其面临着编程要求高、产能低和调试的困难等挑战。本项目在由GPU集群构成的异构多核计算平台上,以软件分布式共享内存模型为基础,研究基于GPU设备内存的分布式共享设备内存的编程模型,达到简化编程,优化性能的目的。重点研究如下几个问题:(1)基于GPU设备内存、主存的两级共享内存的数据一致性维护;(2)GPU设备内存地址空间到主存地址空间的映射机制;(3)CPU-GPU间负载合理分配策略;(4)共享内存中数据预取策略。本项目旨在能为降低异构多核平台上的编程复杂性,提高编程效率奠定理论和技术基础。

中文关键词: 高性能计算;GPU;编程模型;性能优化;

英文摘要: Heterogeneous multicore architecture has been becoming the mainstream architecture in high performance computing community. However, due to its architecture is so complexity and diversity, neither of the traditional mainstream message-passing and shared memory programming models could describe the role of the computing units. So the some challenge is unavoidable to face, include programing on it is very difficult, achieving productivity and portability is also hard. This project aims to meet these challenges through studying a new programming model based on software distributed shared memory. The research focus on the following topics :(1) Data consistency maintenance through main memory to the GPU device memory.(2) the address space mapping mechanism from GPU device memory to main memory.(3) the load balancing strategy between CPU and GPU. (4) the data prefetching scheme for shared data. The project aims to do some fundamental research to reduce the programming complexity for the heterogeneous multicore platforms and improve programming productivity.

英文关键词: HPC;GPU;Programming model;Performance optimization;

成为VIP会员查看完整内容
0

相关内容

2021图灵奖Jack Dongarra经典书《高性能并行计算》,852页pdf
专知会员服务
109+阅读 · 2022年3月31日
【博士论文】分形计算系统
专知会员服务
33+阅读 · 2021年12月9日
专知会员服务
22+阅读 · 2021年7月15日
专知会员服务
18+阅读 · 2021年6月29日
【干货书】Python科学编程,451页pdf
专知会员服务
127+阅读 · 2021年6月27日
【耶鲁】数据结构与编程技术,656页pdf
专知会员服务
55+阅读 · 2021年4月26日
【硬核书】可扩展机器学习:并行分布式方法
专知会员服务
85+阅读 · 2020年5月23日
当云原生遇上低代码,云端开发so easy!
MySQL 深潜 - MDL 锁的实现与获取机制
阿里技术
0+阅读 · 2022年3月11日
CUDA 编程上手指南(一):CUDA C 编程及 GPU 基本知识
极市平台
6+阅读 · 2021年12月17日
【博士论文】分形计算系统
专知
2+阅读 · 2021年12月9日
盘点来自工业界的GPU共享方案
计算机视觉life
12+阅读 · 2021年9月2日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
21+阅读 · 2019年3月25日
Arxiv
13+阅读 · 2018年1月20日
小贴士
相关主题
相关VIP内容
2021图灵奖Jack Dongarra经典书《高性能并行计算》,852页pdf
专知会员服务
109+阅读 · 2022年3月31日
【博士论文】分形计算系统
专知会员服务
33+阅读 · 2021年12月9日
专知会员服务
22+阅读 · 2021年7月15日
专知会员服务
18+阅读 · 2021年6月29日
【干货书】Python科学编程,451页pdf
专知会员服务
127+阅读 · 2021年6月27日
【耶鲁】数据结构与编程技术,656页pdf
专知会员服务
55+阅读 · 2021年4月26日
【硬核书】可扩展机器学习:并行分布式方法
专知会员服务
85+阅读 · 2020年5月23日
相关资讯
当云原生遇上低代码,云端开发so easy!
MySQL 深潜 - MDL 锁的实现与获取机制
阿里技术
0+阅读 · 2022年3月11日
CUDA 编程上手指南(一):CUDA C 编程及 GPU 基本知识
极市平台
6+阅读 · 2021年12月17日
【博士论文】分形计算系统
专知
2+阅读 · 2021年12月9日
盘点来自工业界的GPU共享方案
计算机视觉life
12+阅读 · 2021年9月2日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员