Nesterov动量是动量的变种。与Momentum唯一区别就是,计算梯度的不同,Nesterov动量先用当前的速度v更新一遍参数,在用更新的临时参数计算梯度。
没有数据了, 换个别的吧!
微信扫码咨询专知VIP会员