梯度下降法算法用梯度乘以一个称为学习速率(有时也称为步长)的标量,以确定下一个点的位置。如果学习速率太小,则会使收敛过慢,如果学习速率太大,则会导致代价函数振荡。
[Machine Learning] 深度学习中消失的梯度
全球人工智能
0+阅读 · 2017年12月6日
7个实用的深度学习技巧
机器学习算法与Python学习
16+阅读 · 2019年3月6日
2017年深度学习优化算法最新综述
计算机视觉战队
6+阅读 · 2017年12月18日
BAT机器学习面试1000题(496~500题)
七月在线实验室
1+阅读 · 2018年9月30日
7个实用的深度学习技巧
深度学习
2+阅读 · 2018年2月12日
利用自组织映射解决旅行推销员问题
论智
1+阅读 · 2018年1月28日
干货 | 多任务深度学习的三个经验教训
AI科技评论
5+阅读 · 2019年2月15日
74.7秒训练完ImageNet!刷新记录,2048 GPU暴力出奇迹
炼数成金订阅号
0+阅读 · 2019年4月2日
参考链接
父主题
微信扫码咨询专知VIP会员