项目名称: 众核体系架构并行计算模型与算法自适应调优框架研究

项目编号: No.61272136

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 张云泉

作者单位: 中国科学院计算技术研究所

项目金额: 82万元

中文摘要: 众核架构已成为处理器体系结构发展新趋势,其多粒度并行性、复杂存储层次和有限存储带宽等都对并行算法的性能调优及性能可移植提出巨大挑战。FFT、稠密矩阵计算和OpenCV是三类不同的典型应用核心算法库,如何有效提高三类算法在众核上的运行和开发效率成为一个迫切需要解决的问题。本项目拟针对三类典型核心算法在众核上的性能可移植和高效实现开展研究,主要研究内容包括:1)新的众核并行计算模型研究。对众核架构的多粒度计算和多层次存储等关键特性进行建模,用以指导众核并行算法设计和分析;2)基于计算与访存模式分离指导语句的并行编程框架研究。利用并行计算模型和基于手工调优形成的优化方法链进行双向验证,提出一套基于计算和访存模式分离的制导语句的并行程序设计框架;3)算法自适应性能调优框架原型研究。将调优框架从过去的仅仅是平台自适应,扩展为平台自适应和算法自适应两个维度,进一步提升自适应优化的适用范围和灵活性。

中文关键词: 众核体系架构;并行计算模型;算法自适应;数学库基础算法;OpenCV

英文摘要: Many-core architecture has become the new development trend of processor architecture,Its multi-granularity parallelism,complicated memory hierarchy, and limited memory access bandwidth, etc., poses great challenges on the performance tuning and portability of parallel algorithm. FFT, dense linear algebra subroutine and OpenCV libraries are three very different and classic kernel function libraries. How to improve the running efficiency and development efficiency of these three kinds of libraries on many-core architecture becomes a more and more urgent problem. We plan to carry out researches on the performance portability and high productivity of these three kinds of classic algorithms on many-core architecture. Our major researches including 1) research on a new many-core parallel computational model characterizing with the complex computing hierarchy and memory hierarchy that can provide theoretical analysis results for parallel algorithm design. 2) research on a new parallel programming framework prototype based on splitted computation pattern and memory access pattern directives.Through exhausted validating on the optimization methods chain and our new proposed computational model, we will study on the most powerful methods and used these results to establish a suit of computation pattern directives and mem

英文关键词: manycore architectures;parallel computational model;algorithm self-adaptive;basic linear algebra algorithms;OpenCV

成为VIP会员查看完整内容
1

相关内容

计算体系架构研究综述与思考
专知会员服务
61+阅读 · 2022年3月21日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
32+阅读 · 2022年3月21日
WWW 2022 :基于纯MLP架构的序列推荐模型
专知会员服务
14+阅读 · 2022年3月20日
面向大数据处理框架的JVM优化技术综述
专知会员服务
16+阅读 · 2021年11月27日
专知会员服务
13+阅读 · 2021年6月26日
【经典书】数据结构与算法,770页pdf
专知会员服务
133+阅读 · 2021年4月15日
【南京大学冯雯博士论文】新型深度学习模型的研究
专知会员服务
65+阅读 · 2020年12月5日
计算体系架构研究综述与思考
专知
1+阅读 · 2022年3月22日
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
CUDA高性能计算经典问题:归约
极市平台
1+阅读 · 2022年1月13日
CUDA 并行计算优化策略总结
极市平台
2+阅读 · 2021年12月27日
你的2.6朵云里,会有火山引擎吗?| Q推荐
基于Pytorch的开源推荐算法库
机器学习与推荐算法
1+阅读 · 2021年10月12日
【经典书】数据结构与算法,770页pdf
专知
1+阅读 · 2021年4月15日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
21+阅读 · 2019年3月25日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
10+阅读 · 2018年4月19日
小贴士
相关VIP内容
计算体系架构研究综述与思考
专知会员服务
61+阅读 · 2022年3月21日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
32+阅读 · 2022年3月21日
WWW 2022 :基于纯MLP架构的序列推荐模型
专知会员服务
14+阅读 · 2022年3月20日
面向大数据处理框架的JVM优化技术综述
专知会员服务
16+阅读 · 2021年11月27日
专知会员服务
13+阅读 · 2021年6月26日
【经典书】数据结构与算法,770页pdf
专知会员服务
133+阅读 · 2021年4月15日
【南京大学冯雯博士论文】新型深度学习模型的研究
专知会员服务
65+阅读 · 2020年12月5日
相关资讯
计算体系架构研究综述与思考
专知
1+阅读 · 2022年3月22日
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
CUDA高性能计算经典问题:归约
极市平台
1+阅读 · 2022年1月13日
CUDA 并行计算优化策略总结
极市平台
2+阅读 · 2021年12月27日
你的2.6朵云里,会有火山引擎吗?| Q推荐
基于Pytorch的开源推荐算法库
机器学习与推荐算法
1+阅读 · 2021年10月12日
【经典书】数据结构与算法,770页pdf
专知
1+阅读 · 2021年4月15日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员