SRAM Processing-in-Memory (PIM) has emerged as the most promising implementation for high-performance PIM, delivering superior computing density, energy efficiency, and computational precision. However, the pursuit of higher performance necessitates more complex circuit designs and increased operating frequencies, which exacerbate IR-drop issues. Severe IR-drop can significantly degrade chip performance and even threaten reliability. Conventional circuit-level IR-drop mitigation methods, such as back-end optimizations, are resource-intensive and often compromise power, performance, and area (PPA). To address these challenges, we propose AIM, comprehensive software and hardware co-design for architecture-level IR-drop mitigation in high-performance PIM. Initially, leveraging the bit-serial and in-situ dataflow processing properties of PIM, we introduce Rtog and HR, which establish a direct correlation between PIM workloads and IR-drop. Building on this foundation, we propose LHR and WDS, enabling extensive exploration of architecture-level IR-drop mitigation while maintaining computational accuracy through software optimization. Subsequently, we develop IR-Booster, a dynamic adjustment mechanism that integrates software-level HR information with hardware-based IR-drop monitoring to adapt the V-f pairs of the PIM macro, achieving enhanced energy efficiency and performance. Finally, we propose the HR-aware task mapping method, bridging software and hardware designs to achieve optimal improvement. Post-layout simulation results on a 7nm 256-TOPS PIM chip demonstrate that AIM achieves up to 69.2% IR-drop mitigation, resulting in 2.29x energy efficiency improvement and 1.152x speedup.


翻译:SRAM存内计算已成为高性能存内计算最有前景的实现方案,其具备卓越的计算密度、能效和计算精度。然而,对更高性能的追求需要更复杂的电路设计和更高的工作频率,这加剧了IR压降问题。严重的IR压降会显著降低芯片性能,甚至威胁可靠性。传统的电路级IR压降缓解方法,如后端优化,资源消耗大,且常常在功耗、性能和面积之间折衷。为应对这些挑战,我们提出了AIM,一种面向高性能存内计算架构级IR压降缓解的综合性软硬件协同设计方案。首先,利用存内计算的位串行和原位数据流处理特性,我们引入了Rtog和HR,建立了存内计算工作负载与IR压降之间的直接关联。在此基础上,我们提出了LHR和WDS,通过软件优化在保持计算精度的同时,实现对架构级IR压降缓解方案的广泛探索。随后,我们开发了IR-Booster,一种动态调整机制,它将软件级的HR信息与基于硬件的IR压降监测相结合,以自适应调整存内计算宏的电压-频率对,从而实现能效和性能的提升。最后,我们提出了HR感知的任务映射方法,桥接软硬件设计以实现最优改进。基于7纳米工艺、256 TOPS的存内计算芯片的后布局仿真结果表明,AIM最高可实现69.2%的IR压降缓解,带来2.29倍的能效提升和1.152倍的加速比。

0
下载
关闭预览

相关内容

信息检索杂志(IR)为信息检索的广泛领域中的理论、算法分析和实验的发布提供了一个国际论坛。感兴趣的主题包括对应用程序(例如Web,社交和流媒体,推荐系统和文本档案)的搜索、索引、分析和评估。这包括对搜索中人为因素的研究、桥接人工智能和信息检索以及特定领域的搜索应用程序。 官网地址:https://dblp.uni-trier.de/db/journals/ir/
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员