这篇论文从二值化网络训练过程中的常见问题切入,一步步给出对应的解决方案,最后收敛到了一个实用化的训练策略。接下来就跟着这篇论文一起看看二值化网络(BNN)应该如何优化。

首先,BNN 的优化器应该如何选取?

可以看到,BNN 的优化曲面明显不同于实数值网络,如下图所示。实数值网络在局部最小值附近有更加平滑的曲面,因此实数值网络也更容易泛化到测试集。相比而言,BNN 的优化曲面更陡,因此泛化性差并且优化难度大。

成为VIP会员查看完整内容
14

相关内容

专知会员服务
19+阅读 · 2021年9月16日
专知会员服务
20+阅读 · 2021年8月24日
专知会员服务
27+阅读 · 2021年8月2日
专知会员服务
20+阅读 · 2021年8月1日
专知会员服务
30+阅读 · 2021年7月19日
专知会员服务
11+阅读 · 2021年7月4日
专知会员服务
19+阅读 · 2021年5月30日
专知会员服务
25+阅读 · 2021年5月23日
专知会员服务
14+阅读 · 2021年5月12日
专知会员服务
81+阅读 · 2021年5月10日
深度学习网络调参技巧
AINLP
15+阅读 · 2019年11月15日
如何训练你的ResNet(三):正则化
论智
5+阅读 · 2018年11月13日
如何改进梯度下降算法
论智
9+阅读 · 2018年4月19日
【教程】如何估算深度神经网络的最优学习率
GAN生成式对抗网络
5+阅读 · 2017年11月18日
教程 | 如何估算深度神经网络的最优学习率
机器之心
3+阅读 · 2017年11月17日
机器学习(16)之支持向量机原理(二)软间隔最大化
机器学习算法与Python学习
6+阅读 · 2017年9月8日
[学习] 这些深度学习网络调参技巧,你了解吗?
菜鸟的机器学习
7+阅读 · 2017年7月30日
Tighter risk certificates for neural networks
Arxiv
0+阅读 · 2021年9月22日
Phase-aware Speech Enhancement with Deep Complex U-Net
Arxiv
6+阅读 · 2018年2月6日
Arxiv
7+阅读 · 2017年12月26日
VIP会员
相关VIP内容
专知会员服务
19+阅读 · 2021年9月16日
专知会员服务
20+阅读 · 2021年8月24日
专知会员服务
27+阅读 · 2021年8月2日
专知会员服务
20+阅读 · 2021年8月1日
专知会员服务
30+阅读 · 2021年7月19日
专知会员服务
11+阅读 · 2021年7月4日
专知会员服务
19+阅读 · 2021年5月30日
专知会员服务
25+阅读 · 2021年5月23日
专知会员服务
14+阅读 · 2021年5月12日
专知会员服务
81+阅读 · 2021年5月10日
相关资讯
深度学习网络调参技巧
AINLP
15+阅读 · 2019年11月15日
如何训练你的ResNet(三):正则化
论智
5+阅读 · 2018年11月13日
如何改进梯度下降算法
论智
9+阅读 · 2018年4月19日
【教程】如何估算深度神经网络的最优学习率
GAN生成式对抗网络
5+阅读 · 2017年11月18日
教程 | 如何估算深度神经网络的最优学习率
机器之心
3+阅读 · 2017年11月17日
机器学习(16)之支持向量机原理(二)软间隔最大化
机器学习算法与Python学习
6+阅读 · 2017年9月8日
[学习] 这些深度学习网络调参技巧,你了解吗?
菜鸟的机器学习
7+阅读 · 2017年7月30日
微信扫码咨询专知VIP会员