学习速率 - 专知主题

梯度下降法算法用梯度乘以一个称为学习速率（有时也称为步长）的标量，以确定下一个点的位置。如果学习速率太小,则会使收敛过慢,如果学习速率太大,则会导致代价函数振荡。

没有数据了, 换个别的吧!

参考链接

父主题

微信扫码咨询专知VIP会员