主题: Meet AdaMod: a new deep learning optimizer with memory
简介: AdaMod是一个新的深度学习优化器,它建立在Adam的基础上,但提供了一个自动预热启发式和长期学习率缓冲。从最初的测试来看,AdaMod是一个前5名的优化器,它很容易击败或超过vanilla Adam,同时对学习率超参数不太敏感,训练曲线更平滑,不需要热身模式。