项目名称: 分簇VLIW处理器的模调度及低功耗编译优化技术研究

项目编号: No.61303072

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 张雪萌

作者单位: 中国人民解放军国防科学技术大学

项目金额: 25万元

中文摘要: VLIW(Very Long Instruction Word)体系结构在嵌入式处理器中得到了广泛的引用。分簇是改进VLIW处理器可扩展性及能量消耗的一种有效技术。通过编译技术优化应用程序的性能,以及在不影响程序运行性能的条件下最小化系统或处理器的运行功耗,是目前编译优化技术的研究热点。分簇VLIW体系结构带来的簇间指令分配问题,对编译器中的指令调度、寄存器分配、软件流水等问题提出了更大的挑战。本项目将通过指令调度、寄存器分配、软件流水等编译技术有效地优化程序在分簇VLIW处理器的运行时间和功耗。针对串行程序提出有效地降低分簇VLIW DSP处理器功能部件功耗的指令调度和寄存器分配算法。针对循环分别提出有效优化分簇VLIW DSP处理器性能以及功耗的指令调度和寄存器分配算法。将算法实现和应用在Trimaran编译器中。此外,提出准确的性能模型和功耗模型来评估程序的运行时间和能量消耗。

中文关键词: 分簇VLIW处理器;模调度;低功耗;指令调度;寄存器分配

英文摘要: VLIW (Very Long InstructionWord) architecture has been widely used in embedded processors. VLIW processors issue and execute multiple operations in parallel, on different functional units at each processor cycle. A major problem with VLIW processors is that a single register file hampers the scalability of the processor. Clustering is an efficient technique for improving the scalability and energy consumption of VLIW processors. In a clustered VLIW processor, each cluster has its own functional units and local register file with fewer registers and ports. Clusters are connected by an inter-cluster communication network. An optimising compiler plays a key role in improving the ILP (Instruction Level Parallelism) for clustered VLIW processors. Instruction scheduling and register allocation are two important parts in an optimising compiler for clustered VLIW processors. These two parts are closely related and have a significant impact on the ILP. Software pipelining is an important instruction scheduling technique for efficiently exploiting the ILP of loops by overlapping the execution of successive iterations. Modulo scheduling is a class of software pipelining algorithms that has been incorporated into some product compilers. Clustered VLIW processors make instruction scheduling, register allocation and modulo sc

英文关键词: Clustered VLIW ProcessorsClustered VLIW Processors;Modulo Scheduling;Leakage Power Reduction;Instruction Scheduling;Register Allocation

成为VIP会员查看完整内容
0

相关内容

【博士论文】分形计算系统
专知会员服务
34+阅读 · 2021年12月9日
面向大数据处理框架的JVM优化技术综述
专知会员服务
17+阅读 · 2021年11月27日
专知会员服务
19+阅读 · 2021年6月29日
图计算加速架构综述
专知会员服务
50+阅读 · 2021年4月5日
深度学习组合优化,30页ppt,阿姆斯特丹Wouter Kool讲授
专知会员服务
27+阅读 · 2021年2月27日
专知会员服务
79+阅读 · 2020年8月4日
用 TornadoVM 让 Java 性能更上一个台阶
InfoQ
0+阅读 · 2022年4月1日
hyengine - 面向移动端的高性能通用编译/解释引擎
PyTorch | 优化神经网络训练的17种方法
极市平台
3+阅读 · 2021年12月30日
V8 编译浅谈
阿里技术
1+阅读 · 2021年12月17日
面向大数据处理框架的JVM优化技术综述
专知
0+阅读 · 2021年11月27日
TurboTransformers开源技术文档
微信AI
0+阅读 · 2020年4月24日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Convex-Concave Min-Max Stackelberg Games
Arxiv
0+阅读 · 2022年4月19日
Arxiv
27+阅读 · 2021年11月11日
Arxiv
27+阅读 · 2017年12月6日
小贴士
相关VIP内容
【博士论文】分形计算系统
专知会员服务
34+阅读 · 2021年12月9日
面向大数据处理框架的JVM优化技术综述
专知会员服务
17+阅读 · 2021年11月27日
专知会员服务
19+阅读 · 2021年6月29日
图计算加速架构综述
专知会员服务
50+阅读 · 2021年4月5日
深度学习组合优化,30页ppt,阿姆斯特丹Wouter Kool讲授
专知会员服务
27+阅读 · 2021年2月27日
专知会员服务
79+阅读 · 2020年8月4日
相关资讯
用 TornadoVM 让 Java 性能更上一个台阶
InfoQ
0+阅读 · 2022年4月1日
hyengine - 面向移动端的高性能通用编译/解释引擎
PyTorch | 优化神经网络训练的17种方法
极市平台
3+阅读 · 2021年12月30日
V8 编译浅谈
阿里技术
1+阅读 · 2021年12月17日
面向大数据处理框架的JVM优化技术综述
专知
0+阅读 · 2021年11月27日
TurboTransformers开源技术文档
微信AI
0+阅读 · 2020年4月24日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员