【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型 - 专知VIP

会员服务 ·

0

CVPR 2020 · 卷积神经网络 ·

2020 年 5 月 7 日

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在CVPR 2020上，商汤研究院链接与编译团队、高性能计算团队和北航刘祥龙老师团队合作提出了用于加速卷积神经网络训练过程的INT8训练技术。该工作通过将网络的输入、权重和梯度量化到8比特来加速网络的前向传播和反向传播过程，缩短卷积神经网络训练时间。

论文观察到梯度的独特分布给量化训练带来了极大挑战，为了解决梯度量化带来的精度损失和不稳定问题，该论文进行了量化训练收敛稳定性的理论分析并基于此提出了误差敏感的学习率调节和基于方向自适应的梯度截断方法。同时为了保证更高的加速比，该论文还提出使用周期更新、量化卷积融合等技术来减少量化操作带来的时间开销。

应用了上述方法之后，INT8训练在图像分类任务和检测任务上都仅仅损失微小的精度，且训练过程相比浮点训练加速了22%。

成为VIP会员查看完整内容

26

相关内容

CVPR 2020

CVPR is the premier annual computer vision event comprising the main conference and several co-located workshops and short courses. With its high quality and low cost, it provides an exceptional value for students, academics and industry researchers. CVPR 2020 will take place at The Washington State Convention Center in Seattle, WA, from June 16 to June 20, 2020. http://cvpr2020.thecvf.com/

[ICML-Google]先宽后窄:对深度薄网络的有效训练

[ICML-Google]先宽后窄:对深度薄网络的有效训练

专知会员服务

36+阅读 · 2020年7月5日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

专知会员服务

26+阅读 · 2020年4月7日

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

专知会员服务

31+阅读 · 2020年4月6日

【CVPR2020-Oral】用于任务感知的持续学习的条件信道门控网络

专知会员服务

21+阅读 · 2020年4月2日

【CVPR2020-百度】用于视觉识别的门控信道变换

【CVPR2020-百度】用于视觉识别的门控信道变换

专知会员服务

13+阅读 · 2020年3月30日

【Nature论文】深度网络中的梯度下降复杂度控制

【Nature论文】深度网络中的梯度下降复杂度控制

专知会员服务

41+阅读 · 2020年3月9日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

专知会员服务

14+阅读 · 2020年1月1日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

极市平台

6+阅读 · 2019年5月19日

CVPR 2019 | 用异构卷积训练深度CNN：提升效率而不损准确度

CVPR 2019 | 用异构卷积训练深度CNN：提升效率而不损准确度

计算机视觉life

6+阅读 · 2019年3月25日

CVPR2019 | 专门为卷积神经网络设计的训练方法：RePr

CVPR2019 | 专门为卷积神经网络设计的训练方法：RePr

人工智能前沿讲习班

6+阅读 · 2019年3月7日

计算机视觉领域最全汇总

计算机视觉领域最全汇总

极市平台

6+阅读 · 2018年9月4日

CVPR 2018 | 商汤科技论文详解：立体匹配神经网络的自适应训练

CVPR 2018 | 商汤科技论文详解：立体匹配神经网络的自适应训练

商汤科技

7+阅读 · 2018年6月20日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

CVPR 2018 | 商汤科技Spotlight论文详解：极低延迟性的视频语义分割

CVPR 2018 | 商汤科技Spotlight论文详解：极低延迟性的视频语义分割

商汤科技

4+阅读 · 2018年5月30日

AAAI 2018 | 港中文-商汤联合论文：自监督语义分割的混合与匹配调节

AAAI 2018 | 港中文-商汤联合论文：自监督语义分割的混合与匹配调节

机器之心

4+阅读 · 2018年2月12日

CVPR | ImageNet冠军模型SE-Net详解！

CVPR | ImageNet冠军模型SE-Net详解！

全球人工智能

3+阅读 · 2017年8月2日

SlowFast Networks for Video Recognition

SlowFast Networks for Video Recognition

Arxiv

4+阅读 · 2019年4月18日

Residual Non-local Attention Networks for Image Restoration

Arxiv

9+阅读 · 2019年3月24日

Panoptic Feature Pyramid Networks

Panoptic Feature Pyramid Networks

Arxiv

3+阅读 · 2019年1月8日

Interpretable and Compositional Relation Learning by Joint Training with an Autoencoder

Arxiv

4+阅读 · 2018年5月24日

Bilinear Attention Networks

Arxiv

11+阅读 · 2018年5月21日

Depth Masked Discriminative Correlation Filter

Arxiv

7+阅读 · 2018年2月26日

Graph Attention Networks

Arxiv

10+阅读 · 2018年2月4日

Dynamic Weight Alignment for Convolutional Neural Networks

Arxiv

6+阅读 · 2018年1月25日

Arxiv

7+阅读 · 2018年1月24日

Detecting and counting tiny faces

Arxiv

4+阅读 · 2018年1月19日

VIP会员

相关主题

卷积神经网络

相关VIP内容

[ICML-Google]先宽后窄:对深度薄网络的有效训练

[ICML-Google]先宽后窄:对深度薄网络的有效训练

专知会员服务

36+阅读 · 2020年7月5日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

专知会员服务

26+阅读 · 2020年4月7日

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

专知会员服务

31+阅读 · 2020年4月6日

【CVPR2020-Oral】用于任务感知的持续学习的条件信道门控网络

专知会员服务

21+阅读 · 2020年4月2日

【CVPR2020-百度】用于视觉识别的门控信道变换

【CVPR2020-百度】用于视觉识别的门控信道变换

专知会员服务

13+阅读 · 2020年3月30日

【Nature论文】深度网络中的梯度下降复杂度控制

【Nature论文】深度网络中的梯度下降复杂度控制

专知会员服务

41+阅读 · 2020年3月9日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

专知会员服务

14+阅读 · 2020年1月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《步兵小单元山地严寒作战指南》美军最新条令200页

《联合作战概念的发展》最新报告

俄制无人机弹药

《复杂场景下自主着陆的模型预测控制技术》92页

相关资讯

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

极市平台

6+阅读 · 2019年5月19日

CVPR 2019 | 用异构卷积训练深度CNN：提升效率而不损准确度

CVPR 2019 | 用异构卷积训练深度CNN：提升效率而不损准确度

计算机视觉life

6+阅读 · 2019年3月25日

CVPR2019 | 专门为卷积神经网络设计的训练方法：RePr

CVPR2019 | 专门为卷积神经网络设计的训练方法：RePr

人工智能前沿讲习班

6+阅读 · 2019年3月7日

计算机视觉领域最全汇总

计算机视觉领域最全汇总

极市平台

6+阅读 · 2018年9月4日

CVPR 2018 | 商汤科技论文详解：立体匹配神经网络的自适应训练

CVPR 2018 | 商汤科技论文详解：立体匹配神经网络的自适应训练

商汤科技

7+阅读 · 2018年6月20日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

CVPR 2018 | 商汤科技Spotlight论文详解：极低延迟性的视频语义分割

CVPR 2018 | 商汤科技Spotlight论文详解：极低延迟性的视频语义分割

商汤科技

4+阅读 · 2018年5月30日

AAAI 2018 | 港中文-商汤联合论文：自监督语义分割的混合与匹配调节

AAAI 2018 | 港中文-商汤联合论文：自监督语义分割的混合与匹配调节

机器之心

4+阅读 · 2018年2月12日

CVPR | ImageNet冠军模型SE-Net详解！

CVPR | ImageNet冠军模型SE-Net详解！

全球人工智能

3+阅读 · 2017年8月2日

相关论文

SlowFast Networks for Video Recognition

SlowFast Networks for Video Recognition

Arxiv

4+阅读 · 2019年4月18日

Residual Non-local Attention Networks for Image Restoration

Arxiv

9+阅读 · 2019年3月24日

Panoptic Feature Pyramid Networks

Panoptic Feature Pyramid Networks

Arxiv

3+阅读 · 2019年1月8日

Interpretable and Compositional Relation Learning by Joint Training with an Autoencoder

Arxiv

4+阅读 · 2018年5月24日

Bilinear Attention Networks

Arxiv

11+阅读 · 2018年5月21日

Depth Masked Discriminative Correlation Filter

Arxiv

7+阅读 · 2018年2月26日

Graph Attention Networks

Arxiv

10+阅读 · 2018年2月4日

Dynamic Weight Alignment for Convolutional Neural Networks

Arxiv

6+阅读 · 2018年1月25日

Arxiv

7+阅读 · 2018年1月24日

Detecting and counting tiny faces

Arxiv

4+阅读 · 2018年1月19日

微信扫码咨询专知VIP会员