Processing-in-memory (PIM) seeks to eliminate computation/memory data transfer using devices that support both storage and logic. Stateful logic techniques such as IMPLY, MAGIC and FELIX can perform logic gates within memristive crossbar arrays with massive parallelism. Multiplication via stateful logic is an active field of research due to the wide implications. Recently, RIME has become the state-of-the-art algorithm for stateful single-row multiplication by using memristive partitions, reducing the latency of the previous state-of-the-art by 5.1x. In this paper, we begin by proposing novel partition-based computation techniques for broadcasting and shifting data. Then, we design an in-memory multiplication algorithm based on the carry-save add-shift (CSAS) technique. Finally, we develop a novel stateful full-adder that significantly improves the state-of-the-art (FELIX) design. These contributions constitute MultPIM, a multiplier that reduces state-of-the-art time complexity from quadratic to linear-log. For 32-bit numbers, MultPIM improves latency by an additional 4.2x over RIME, while even slightly reducing area overhead. Furthermore, we optimize MultPIM for full-precision matrix-vector multiplication and improve latency by 25.5x over FloatPIM matrix-vector multiplication.


翻译:PIM 试图用支持存储和逻辑的装置消除计算/模拟数据传输。 IMPLY、 MAGIC 和 FELIX 等状态逻辑技术可以在弥漫的跨条形阵列中用大量平行的超线阵列运行逻辑门。 由于具有广泛的影响, 光学逻辑的乘法是一个积极的研究领域。 最近, RIME 已经成为了使用中间分区进行状态性单行倍增的最先进的算法, 降低了5. 5x 先前状态的静态。 在本文中, 我们首先提出基于新颖的基于分区的计算技术, 用于广播和移动数据。 然后, 我们设计了一个基于随传加转( CSAS) 技术的模拟倍增算法。 最后, 我们开发了一个新的状态全局全局算法, 大大改进了状态( FELIX ) 的矩阵设计。 这些贡献构成 mutPIM, 一种超常值的乘数, 降低状态时间复杂性, 从平面的平面平面平面平面平面平面平面平面平面平面平面平面平面。

0
下载
关闭预览

相关内容

【干货书】开放数据结构,Open Data Structures,337页pdf
专知会员服务
16+阅读 · 2021年9月17日
专知会员服务
76+阅读 · 2021年3月16日
【斯坦福经典书最新版】语音语言处理,653页pdf
专知会员服务
51+阅读 · 2021年1月1日
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
165+阅读 · 2020年4月26日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
用 NumPy 写一个RNN、LSTM,这可能是最好的入门方式!
Hierarchically Structured Meta-learning
CreateAMind
25+阅读 · 2019年5月22日
ICLR2019最佳论文出炉
专知
12+阅读 · 2019年5月6日
已删除
创业邦杂志
5+阅读 · 2019年3月27日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
时间序列深度学习:状态 LSTM 模型预测太阳黑子(下)
R语言中文社区
9+阅读 · 2018年6月15日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
最佳实践:深度学习用于自然语言处理(三)
待字闺中
3+阅读 · 2017年8月20日
Arxiv
0+阅读 · 2021年11月8日
Arxiv
9+阅读 · 2021年6月21日
Arxiv
3+阅读 · 2018年2月24日
Arxiv
4+阅读 · 2015年8月25日
VIP会员
相关资讯
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
用 NumPy 写一个RNN、LSTM,这可能是最好的入门方式!
Hierarchically Structured Meta-learning
CreateAMind
25+阅读 · 2019年5月22日
ICLR2019最佳论文出炉
专知
12+阅读 · 2019年5月6日
已删除
创业邦杂志
5+阅读 · 2019年3月27日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
时间序列深度学习:状态 LSTM 模型预测太阳黑子(下)
R语言中文社区
9+阅读 · 2018年6月15日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
最佳实践:深度学习用于自然语言处理(三)
待字闺中
3+阅读 · 2017年8月20日
Top
微信扫码咨询专知VIP会员