Always-on TinyML perception tasks in IoT applications require very high energy efficiency. Analog compute-in-memory (CiM) using non-volatile memory (NVM) promises high efficiency and also provides self-contained on-chip model storage. However, analog CiM introduces new practical considerations, including conductance drift, read/write noise, fixed analog-to-digital (ADC) converter gain, etc. These additional constraints must be addressed to achieve models that can be deployed on analog CiM with acceptable accuracy loss. This work describes $\textit{AnalogNets}$: TinyML models for the popular always-on applications of keyword spotting (KWS) and visual wake words (VWW). The model architectures are specifically designed for analog CiM, and we detail a comprehensive training methodology, to retain accuracy in the face of analog non-idealities, and low-precision data converters at inference time. We also describe AON-CiM, a programmable, minimal-area phase-change memory (PCM) analog CiM accelerator, with a novel layer-serial approach to remove the cost of complex interconnects associated with a fully-pipelined design. We evaluate the AnalogNets on a calibrated simulator, as well as real hardware, and find that accuracy degradation is limited to 0.8$\%$/1.2$\%$ after 24 hours of PCM drift (8-bit) for KWS/VWW. AnalogNets running on the 14nm AON-CiM accelerator demonstrate 8.58/4.37 TOPS/W for KWS/VWW workloads using 8-bit activations, respectively, and increasing to 57.39/25.69 TOPS/W with $4$-bit activations.


翻译:在 IOT 应用中, 总是 TinyML 的感知任务要求非常高的能效。 使用非挥发性内存( NVM) 进行模拟计算( CiM ) 的模拟计算( CiM ) 将带来更高的效率, 并提供自足的芯片模型存储。 然而, 模拟 Cim 引入了新的实际考虑, 包括导演流、 读/ 字噪音、 固定的模拟- 数字转换器( ADC ) 等。 这些额外的限制必须得到解决, 才能在模拟 CIM 上安装模型, 并具有可接受的准确性损失。 这项工作描述了 $: $: 透明( Textit{ Analogy) 流化( CiM ), 用于8- sws) 识别关键字( KWM ) 和 直径( QM) 快速读数( ), 用于 将 IM 系统/ 的模拟 系统- 系统- 升级( ) 系统- 系统- 升级( ) 系统化( ) ) 和 系统( 快速) 系统( ) 系统内部) 升级( ) 升级( ) ), 进行实时) 实时) 进行实时( 的实时) 的系统- 的系统- 的系统- 和系统- 实时) 系统- 系统- 系统- 升级(, 升级( 升级( ) 升级( ) 升级( ) ) 升级( ) 的系统-, 的实时),, 的系统- 实时) 的系统-,, 的系统-,,, 和系统- 系统- ) 系统- 系统- ) 系统-,,,,,, 系统- 系统- 系统- 系统- 系统- 系统- 系统- 系统- 系统- 系统- 系统- 系统- 系统- 系统-,,用于-,, 和,,,,, 和, 系统- 系统- 系统- 系统- 的

0
下载
关闭预览

相关内容

【CHI2021】可解释人工智能导论
专知会员服务
118+阅读 · 2021年5月25日
霍普金斯《操作系统原理》2020课程,不可错过!
专知会员服务
35+阅读 · 2020年10月27日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
144+阅读 · 2019年10月12日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
8+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
AI/ML/DNN硬件加速设计怎么入门?
StarryHeavensAbove
10+阅读 · 2018年12月4日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
6+阅读 · 2020年10月8日
Arxiv
7+阅读 · 2018年6月8日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
8+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
AI/ML/DNN硬件加速设计怎么入门?
StarryHeavensAbove
10+阅读 · 2018年12月4日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员