题目: Training Binary Neural Networks with Real-to-Binary Convolutions

摘要:

本文展示了如何将二进制网络训练到与完全精确网络相当的几个百分点(∼3−5%)之内。我们首先展示如何建立一个强大的基线,该基线通过结合最近提出的进展和仔细调整优化过程已经达到了最先进的精度。其次,我们证明了通过最小化二进制信号的输出和相应的实值卷积之间的差异,可以获得额外显著的精度增益。我们以两种互补的方式实现了这个想法:

  • (1)具有损失函数,在训练过程中,通过对二值卷积和实值卷积输出的空间注意图进行匹配;
  • (2)以数据驱动的方式,利用二值化过程之前的推理过程中可用的实值激活,在二进制卷积之后重新缩放激活。

最后,我们证明,当我们把所有的改进放在一起,当使用ResNet-18架构时,该模型在ImageNet上的top-1精度超过当前水平的5%,并将其与CIFAR-100和ImageNet上的real-value精度的差距分别降低到不足3%和5%。

成为VIP会员查看完整内容
25

相关内容

在数学(特别是功能分析)中,卷积是对两个函数(f和g)的数学运算,产生三个函数,表示第一个函数的形状如何被另一个函数修改。 卷积一词既指结果函数,又指计算结果的过程。 它定义为两个函数的乘积在一个函数反转和移位后的积分。 并针对所有shift值评估积分,从而生成卷积函数。
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
48+阅读 · 2020年7月4日
【ICML2020】持续图神经网络,Continuous Graph Neural Networks
专知会员服务
149+阅读 · 2020年6月28日
【Google】监督对比学习,Supervised Contrastive Learning
专知会员服务
74+阅读 · 2020年4月24日
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
31+阅读 · 2020年4月15日
【阿里巴巴-CVPR2020】频域学习,Learning in the Frequency Domain
【NeurIPS2019】图变换网络:Graph Transformer Network
CVPR 2019 | PointConv:在点云上高效实现卷积操作
机器之心
10+阅读 · 2019年4月21日
CVPR2018 | Decoupled Networks
极市平台
4+阅读 · 2019年3月22日
干货|多重预训练视觉模型的迁移学习
全球人工智能
5+阅读 · 2017年12月19日
BranchOut: Regularization for Online Ensemble Tracking with CNN
统计学习与视觉计算组
9+阅读 · 2017年10月7日
Highway Networks For Sentence Classification
哈工大SCIR
4+阅读 · 2017年9月30日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
12+阅读 · 2018年9月15日
Arxiv
3+阅读 · 2018年8月17日
Arxiv
4+阅读 · 2018年3月23日
VIP会员
相关资讯
微信扫码咨询专知VIP会员