常规符号函数的梯度几乎处处为零,不能用于反向传播。为此,来自华为诺亚方舟实验室等机构的研究者提出一种在频域中估计原始符号函数梯度的新方法。

二值神经网络(BNN)将原始全精度权重和激活用符号函数表征成 1-bit。但是由于常规符号函数的梯度几乎处处为零,不能用于反向传播,因此一些研究已经提出尝试使用近似梯度来减轻优化难度。然而,这些近似破坏了实际梯度的主要方向。

基于此,在一篇 NeurIPS 2021 论文中,来自华为诺亚方舟实验室等机构的研究者提出使用傅里叶级数的组合来估计频域中符号函数的梯度以训练 BNN,即频域逼近 (FDA)。所提方法不影响占整体能量大部分的原始符号函数的低频信息,并且将高频系数使用噪声拟合模块 (noise adaptation module) 进行估计以避免大量的计算开销。

论文地址:https://arxiv.org/pdf/2103.00841.pdf

在几个基准数据集和神经架构上的实验表明,使用该方法学习的二值网络实现了 SOTA 准确率。

成为VIP会员查看完整内容
15

相关内容

专知会员服务
10+阅读 · 2021年6月20日
专知会员服务
15+阅读 · 2021年6月6日
专知会员服务
50+阅读 · 2021年5月19日
【AAAI2021】基于双任务一致性的半监督医学图像分割
专知会员服务
30+阅读 · 2021年2月7日
【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器
专知会员服务
13+阅读 · 2021年1月31日
专知会员服务
16+阅读 · 2020年10月18日
【NeurIPS 2020】核基渐进蒸馏加法器神经网络
专知
13+阅读 · 2020年10月19日
二值神经网络(Binary Neural Networks)最新综述
PaperWeekly
3+阅读 · 2020年3月12日
Arxiv
0+阅读 · 2022年2月17日
A Statistical Learning View of Simple Kriging
Arxiv
0+阅读 · 2022年2月15日
Arxiv
3+阅读 · 2020年9月30日
Bivariate Beta LSTM
Arxiv
5+阅读 · 2019年10月7日
VIP会员
相关VIP内容
专知会员服务
10+阅读 · 2021年6月20日
专知会员服务
15+阅读 · 2021年6月6日
专知会员服务
50+阅读 · 2021年5月19日
【AAAI2021】基于双任务一致性的半监督医学图像分割
专知会员服务
30+阅读 · 2021年2月7日
【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器
专知会员服务
13+阅读 · 2021年1月31日
专知会员服务
16+阅读 · 2020年10月18日
微信扫码咨询专知VIP会员