项目名称: GPU程序访存行为分析和优化关键技术研究

项目编号: No.61402488

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 唐滔

作者单位: 中国人民解放军国防科学技术大学

项目金额: 25万元

中文摘要: 图形处理器(GPU)以其强大的峰值计算能力渐渐成为高性能计算领域研究的热点。由于集成了大量并行的计算核心,GPU 的峰值计算性能远远超过同时期的通用 CPU,然而真实程序往往很难将其计算潜力有效发挥出来,其中“存储墙”问题是制约GPU性能发挥的最主要因素,因此面向GPU片上存储层次的分析和优化对于提高GPU程序的性能具有重要意义。本项目基于对GPU执行特点的深入探索和分析,展开GPU片上存储访问的分析和优化研究,关键内容包括两方面:一是建立GPU片上存储层次访问对程序性能影响的分析模型,包括软件管理的shared memory和硬件管理的cache;二是提出若干面向shared memory和cache的数据访问优化技术。我们希望通过这些研究成果,有效提升GPU片上存储层次的利用率,减少片外访存,充分开发GPU的计算潜力。

中文关键词: 图形处理器;存储层次;优化;;

英文摘要: Graphics Processing Unit (GPU) has attracted much interests in high performance computing area due to its powerful computing performance. With massive parallel computing cores, GPU's peak performance far ex ceeds that of contemporary CPU. However, real a

英文关键词: GPU;Memory Hierarchy;Optimization;;

成为VIP会员查看完整内容
1

相关内容

【博士论文】分形计算系统
专知会员服务
33+阅读 · 2021年12月9日
FPGA加速深度学习综述
专知会员服务
68+阅读 · 2021年11月13日
图计算加速架构综述
专知会员服务
49+阅读 · 2021年4月5日
最新《计算机体系结构和系统的机器学习》综述论文
专知会员服务
54+阅读 · 2021年2月17日
最新《知识蒸馏》2020综述论文,20页pdf,悉尼大学
专知会员服务
157+阅读 · 2020年6月14日
Transformer性能优化:运算和显存
PaperWeekly
1+阅读 · 2022年3月29日
CUDA 编程上手指南(一):CUDA C 编程及 GPU 基本知识
极市平台
6+阅读 · 2021年12月17日
面向大数据处理框架的JVM优化技术综述
专知
0+阅读 · 2021年11月27日
图计算加速架构综述
专知
0+阅读 · 2021年4月5日
TurboTransformers开源技术文档
微信AI
0+阅读 · 2020年4月24日
【数字孪生】数字孪生技术从概念到应用
产业智能官
90+阅读 · 2020年2月16日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2022年4月17日
Arxiv
58+阅读 · 2021年11月15日
Memory-Gated Recurrent Networks
Arxiv
12+阅读 · 2020年12月24日
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
小贴士
相关VIP内容
【博士论文】分形计算系统
专知会员服务
33+阅读 · 2021年12月9日
FPGA加速深度学习综述
专知会员服务
68+阅读 · 2021年11月13日
图计算加速架构综述
专知会员服务
49+阅读 · 2021年4月5日
最新《计算机体系结构和系统的机器学习》综述论文
专知会员服务
54+阅读 · 2021年2月17日
最新《知识蒸馏》2020综述论文,20页pdf,悉尼大学
专知会员服务
157+阅读 · 2020年6月14日
相关资讯
Transformer性能优化:运算和显存
PaperWeekly
1+阅读 · 2022年3月29日
CUDA 编程上手指南(一):CUDA C 编程及 GPU 基本知识
极市平台
6+阅读 · 2021年12月17日
面向大数据处理框架的JVM优化技术综述
专知
0+阅读 · 2021年11月27日
图计算加速架构综述
专知
0+阅读 · 2021年4月5日
TurboTransformers开源技术文档
微信AI
0+阅读 · 2020年4月24日
【数字孪生】数字孪生技术从概念到应用
产业智能官
90+阅读 · 2020年2月16日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员