We introduce an automated tool for deploying ultra low-latency, low-power deep neural networks with convolutional layers on FPGAs. By extending the hls4ml library, we demonstrate an inference latency of $5\,\mu$s using convolutional architectures, targeting microsecond latency applications like those at the CERN Large Hadron Collider. Considering benchmark models trained on the Street View House Numbers Dataset, we demonstrate various methods for model compression in order to fit the computational constraints of a typical FPGA device used in trigger and data acquisition systems of particle detectors. In particular, we discuss pruning and quantization-aware training, and demonstrate how resource utilization can be significantly reduced with little to no loss in model accuracy. We show that the FPGA critical resource consumption can be reduced by 97% with zero loss in model accuracy, and by 99% when tolerating a 6% accuracy degradation.


翻译:我们引入了一种自动工具,用于在FPGAs上部署超低延迟、低功率的深神经网络和富集层。 通过扩展hls4ml图书馆,我们展示了5美元的推论时间,使用CERN大型散子相撞器等结构,针对微秒悬浮应用,如CERN大型散子相撞机。考虑到在街景房数字数据集中培训的基准模型,我们展示了各种模型压缩方法,以适应在粒子探测器触发和数据采集系统中使用的典型FPGA装置的计算限制。特别是,我们讨论了对粒子探测器的运行和量化认知培训,并演示如何在模型精度方面少少少少少一点、零少一点的情况下大大减少资源的利用。我们显示,FPGA的关键资源消耗量可以减少97%,模型精度为零损失,在减缓6%精度降解时则减少99%。

0
下载
关闭预览

相关内容

2021机器学习研究风向是啥?MLP→CNN→Transformer→MLP!
专知会员服务
65+阅读 · 2021年5月23日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
29+阅读 · 2020年3月5日
开源书:PyTorch深度学习起步
专知会员服务
50+阅读 · 2019年10月11日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
AI/ML/DNN硬件加速设计怎么入门?
StarryHeavensAbove
10+阅读 · 2018年12月4日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
CNN模型压缩与加速算法综述
微信AI
6+阅读 · 2017年10月11日
【推荐】MXNet深度情感分析实战
机器学习研究会
16+阅读 · 2017年10月4日
CNN 模型压缩与加速算法综述
机器学习研究会
16+阅读 · 2017年8月25日
【推荐】TensorFlow手把手CNN实践指南
机器学习研究会
5+阅读 · 2017年8月17日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
31+阅读 · 2018年11月13日
Arxiv
5+阅读 · 2018年9月11日
Arxiv
3+阅读 · 2018年6月18日
VIP会员
相关VIP内容
相关资讯
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
AI/ML/DNN硬件加速设计怎么入门?
StarryHeavensAbove
10+阅读 · 2018年12月4日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
CNN模型压缩与加速算法综述
微信AI
6+阅读 · 2017年10月11日
【推荐】MXNet深度情感分析实战
机器学习研究会
16+阅读 · 2017年10月4日
CNN 模型压缩与加速算法综述
机器学习研究会
16+阅读 · 2017年8月25日
【推荐】TensorFlow手把手CNN实践指南
机器学习研究会
5+阅读 · 2017年8月17日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员