内存瓶颈和计算负载问题一举突破？韩松团队提出MUCNetV2：解锁MCU端新纪录！ - 专知VIP

会员服务 ·

1

NeurIPS 2021 · MCU · 目标检测 · TinyDL · 论文 ·

2021 年 11 月 6 日

内存瓶颈和计算负载问题一举突破？韩松团队提出MUCNetV2：解锁MCU端新纪录！

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

由于有限的内存，MCU(MicroController Units, MCU)端的TinyDL极具挑战性。我们发现：内存瓶颈源于CNN设计导致的内存分布不平衡，即网络的前几个模块具有比其他模块大的多的内存占用。

为缓解该问题，我们提出一种广义的patch-by-patch 推理机制，它仅对特征图的局部区域进行处理，大幅降低了峰值内存。然而，常规的实现方式会带来重叠块与计算复杂问题。我们进一步提出了recptive field redistribution 调整感受野与FLOPs以降低整体计算负载。人工方式重分布感受野无疑非常困难！我们采用NAS对网络架构与推理机制进行联合优化得到了本文的MCUNetV2。所提推理机制能大幅降低峰值内存达4-8倍。

所推MCUNetV2取得了MCU端新的ImageNet分类记录71.8% ；更重要的是，MCUNetV2解锁了MCU端执行稠密预测任务的可能性，如目标检测取得了比已有方案高16.9%mAP@VOC的指标。本研究极大程度上解决了TinyDL的内存瓶颈问题，为图像分类之外的其他视觉应用铺平了道路。

成为VIP会员查看完整内容

13

相关内容

NeurIPS 2021

【AAAI2022】SVT-Net的超轻量化网络

【AAAI2022】SVT-Net的超轻量化网络

专知会员服务

21+阅读 · 2021年12月5日

Swin Transformer重磅升级！Swin V2：向更大容量、更高分辨率的更大模型迈进

Swin Transformer重磅升级！Swin V2：向更大容量、更高分辨率的更大模型迈进

专知会员服务

28+阅读 · 2021年11月20日

【ICCV2021】无需检测器提取特征！LeCun团队提出MDETR：实现真正的端到端多模态推理

专知会员服务

19+阅读 · 2021年7月29日

处理器芯片敏捷设计方法：问题与挑战

专知会员服务

19+阅读 · 2021年6月29日

【ECCV2020-旷视】利用边界特征做检测的BorderDet

专知会员服务

13+阅读 · 2020年9月19日

深度神经网络模型压缩综述

专知会员服务

116+阅读 · 2020年8月22日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

CVPR2020 | 南开大学提出SCNet：自校正卷积网络，无复杂度增加换来性能提升

CVPR2020 | 南开大学提出SCNet：自校正卷积网络，无复杂度增加换来性能提升

CVer

9+阅读 · 2020年6月4日

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

专知

31+阅读 · 2019年10月6日

加盟依图科技后，颜水成首篇顶会论文提出“高效多人体姿态检测SPM”

加盟依图科技后，颜水成首篇顶会论文提出“高效多人体姿态检测SPM”

量子位

5+阅读 · 2019年9月16日

GPU 显存不足怎么办？

GPU 显存不足怎么办？

AINLP

13+阅读 · 2019年8月16日

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

机器之心

15+阅读 · 2019年7月13日

南邮提出实时语义分割的轻量级网络：LEDNET，可达 71 FPS！70.6% class mIoU！即将开源

南邮提出实时语义分割的轻量级网络：LEDNET，可达 71 FPS！70.6% class mIoU！即将开源

极市平台

17+阅读 · 2019年5月10日

DL | 语义分割综述

DL | 语义分割综述

机器学习算法与Python学习

58+阅读 · 2019年3月13日

清华发布《AI芯片技术白皮书》：新计算范式，挑战冯诺依曼、CMOS瓶颈

清华发布《AI芯片技术白皮书》：新计算范式，挑战冯诺依曼、CMOS瓶颈

人工智能学家

5+阅读 · 2019年1月16日

无需预训练分类器，清华&旷视提出专用于目标检测的骨干网络DetNet

无需预训练分类器，清华&旷视提出专用于目标检测的骨干网络DetNet

机器之心

8+阅读 · 2018年4月19日

Sufficient Statistic Memory AMP

Sufficient Statistic Memory AMP

Arxiv

0+阅读 · 2022年1月7日

TransVPR: Transformer-based place recognition with multi-level attention aggregation

Arxiv

0+阅读 · 2022年1月6日

Eye Know You Too: A DenseNet Architecture for End-to-end Biometric Authentication via Eye Movements

Arxiv

0+阅读 · 2022年1月5日

Breaking a fully Balanced ASIC Coprocessor Implementing Complete Addition Formulas on Weierstrass Elliptic Curves

Arxiv

0+阅读 · 2022年1月4日

Classification by Attention: Scene Graph Classification with Prior Knowledge

Arxiv

8+阅读 · 2020年11月19日

Dynamic Graph Attention for Referring Expression Comprehension

Dynamic Graph Attention for Referring Expression Comprehension

Arxiv

6+阅读 · 2019年9月18日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

Fire SSD: Wide Fire Modules based Single Shot Detector on Edge Device

Arxiv

3+阅读 · 2018年10月16日

Nonlinear Metric Learning through Geodesic Polylinear Interpolation (ML-GPI)

Arxiv

4+阅读 · 2018年5月15日

Caffeinated FPGAs: FPGA Framework For Convolutional Neural Networks

Arxiv

10+阅读 · 2016年9月30日

VIP会员

相关主题

相关VIP内容

【AAAI2022】SVT-Net的超轻量化网络

【AAAI2022】SVT-Net的超轻量化网络

专知会员服务

21+阅读 · 2021年12月5日

Swin Transformer重磅升级！Swin V2：向更大容量、更高分辨率的更大模型迈进

Swin Transformer重磅升级！Swin V2：向更大容量、更高分辨率的更大模型迈进

专知会员服务

28+阅读 · 2021年11月20日

【ICCV2021】无需检测器提取特征！LeCun团队提出MDETR：实现真正的端到端多模态推理

专知会员服务

19+阅读 · 2021年7月29日

处理器芯片敏捷设计方法：问题与挑战

专知会员服务

19+阅读 · 2021年6月29日

【ECCV2020-旷视】利用边界特征做检测的BorderDet

专知会员服务

13+阅读 · 2020年9月19日

深度神经网络模型压缩综述

专知会员服务

116+阅读 · 2020年8月22日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

CVPR2020 | 南开大学提出SCNet：自校正卷积网络，无复杂度增加换来性能提升

CVPR2020 | 南开大学提出SCNet：自校正卷积网络，无复杂度增加换来性能提升

CVer

9+阅读 · 2020年6月4日

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

专知

31+阅读 · 2019年10月6日

加盟依图科技后，颜水成首篇顶会论文提出“高效多人体姿态检测SPM”

加盟依图科技后，颜水成首篇顶会论文提出“高效多人体姿态检测SPM”

量子位

5+阅读 · 2019年9月16日

GPU 显存不足怎么办？

GPU 显存不足怎么办？

AINLP

13+阅读 · 2019年8月16日

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

机器之心

15+阅读 · 2019年7月13日

南邮提出实时语义分割的轻量级网络：LEDNET，可达 71 FPS！70.6% class mIoU！即将开源

南邮提出实时语义分割的轻量级网络：LEDNET，可达 71 FPS！70.6% class mIoU！即将开源

极市平台

17+阅读 · 2019年5月10日

DL | 语义分割综述

DL | 语义分割综述

机器学习算法与Python学习

58+阅读 · 2019年3月13日

清华发布《AI芯片技术白皮书》：新计算范式，挑战冯诺依曼、CMOS瓶颈

清华发布《AI芯片技术白皮书》：新计算范式，挑战冯诺依曼、CMOS瓶颈

人工智能学家

5+阅读 · 2019年1月16日

无需预训练分类器，清华&旷视提出专用于目标检测的骨干网络DetNet

无需预训练分类器，清华&旷视提出专用于目标检测的骨干网络DetNet

机器之心

8+阅读 · 2018年4月19日

相关论文

Sufficient Statistic Memory AMP

Sufficient Statistic Memory AMP

Arxiv

0+阅读 · 2022年1月7日

TransVPR: Transformer-based place recognition with multi-level attention aggregation

Arxiv

0+阅读 · 2022年1月6日

Eye Know You Too: A DenseNet Architecture for End-to-end Biometric Authentication via Eye Movements

Arxiv

0+阅读 · 2022年1月5日

Breaking a fully Balanced ASIC Coprocessor Implementing Complete Addition Formulas on Weierstrass Elliptic Curves

Arxiv

0+阅读 · 2022年1月4日

Classification by Attention: Scene Graph Classification with Prior Knowledge

Arxiv

8+阅读 · 2020年11月19日

Dynamic Graph Attention for Referring Expression Comprehension

Dynamic Graph Attention for Referring Expression Comprehension

Arxiv

6+阅读 · 2019年9月18日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

Fire SSD: Wide Fire Modules based Single Shot Detector on Edge Device

Arxiv

3+阅读 · 2018年10月16日

Nonlinear Metric Learning through Geodesic Polylinear Interpolation (ML-GPI)

Arxiv

4+阅读 · 2018年5月15日

Caffeinated FPGAs: FPGA Framework For Convolutional Neural Networks

Arxiv

10+阅读 · 2016年9月30日

微信扫码咨询专知VIP会员