Data movement between main memory and the processor is a significant contributor to the execution time and energy consumption of memory-intensive applications. This data movement bottleneck can be alleviated using Processing-in-Memory (PiM), which enables computation inside the memory chip. However, existing PiM architectures often lack support for complex operations, since supporting these operations increases design complexity, chip area, and power consumption. We introduce pLUTo (processing-in-memory with lookup table [LUT] operations), a new DRAM substrate that leverages the high area density of DRAM to enable the massively parallel storing and querying of lookup tables (LUTs). The use of LUTs enables the efficient execution of complex operations in-memory, which has been a long-standing challenge in the domain of PiM. When running a state-of-the-art binary neural network in a single DRAM subarray, pLUTo outperforms the baseline CPU and GPU implementations by $33\times$ and $8\times$, respectively, while simultaneously achieving energy savings of $110\times$ and $80\times$.


翻译:主内存和处理器之间的数据移动是执行时间和内存密集应用的能量消耗的一个重要因素。数据移动瓶颈可以通过处理存储器(PiM)来缓解,从而能够在内存芯片内进行计算。然而,现有的PiM结构往往缺乏对复杂操作的支持,因为支持这些操作会增加设计复杂性、芯片面积和电耗。我们引入了pLUTO(带外观表的处理-模件操作)),一个新的DRAM基质,利用DRAM的高面积密度使外观表(LUTs)能够大规模平行存储和查询。LUTs的使用使复杂的模拟操作能够高效进行,而这是PimM领域长期存在的一个挑战。当一个单一的DRAM 亚拉里运行一个最先进的二进神经网络时,pLUTo比CUP和GPU的基线执行率分别高出33\time和8\time$,同时实现了110\time的节能。

0
下载
关闭预览

相关内容

专知会员服务
153+阅读 · 2021年3月6日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
47+阅读 · 2021年1月20日
【耶鲁】数据结构与编程技术,572页pdf
专知会员服务
45+阅读 · 2020年12月27日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
75+阅读 · 2020年7月26日
【实用书】数据科学基础,484页pdf,Foundations of Data Science
专知会员服务
117+阅读 · 2020年5月28日
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
计算机类 | PLDI 2020等国际会议信息6条
Call4Papers
3+阅读 · 2019年7月8日
【数字孪生】九论数字孪生
产业智能官
57+阅读 · 2019年7月6日
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
计算机 | CCF推荐期刊专刊信息5条
Call4Papers
3+阅读 · 2019年4月10日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
人工智能 | UAI 2019等国际会议信息4条
Call4Papers
6+阅读 · 2019年1月14日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
资源|斯坦福课程:深度学习理论!
全球人工智能
16+阅读 · 2017年11月9日
Arxiv
0+阅读 · 2021年6月7日
Neural Arithmetic Logic Units
Arxiv
5+阅读 · 2018年8月1日
Arxiv
5+阅读 · 2017年11月30日
VIP会员
相关资讯
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
计算机类 | PLDI 2020等国际会议信息6条
Call4Papers
3+阅读 · 2019年7月8日
【数字孪生】九论数字孪生
产业智能官
57+阅读 · 2019年7月6日
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
计算机 | CCF推荐期刊专刊信息5条
Call4Papers
3+阅读 · 2019年4月10日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
人工智能 | UAI 2019等国际会议信息4条
Call4Papers
6+阅读 · 2019年1月14日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
资源|斯坦福课程:深度学习理论!
全球人工智能
16+阅读 · 2017年11月9日
Top
微信扫码咨询专知VIP会员