【ICLR2021】微分动态规划神经优化器

论文名称：DDPNOpt: Differential Dynamic Programming Neural Optimizer

论文链接:

https://www.zhuanzhi.ai/paper/9bd4fb54c41540ebb674f12141d91f37

作者：Guan-Horng Liu、Tianrong Chen、Evangelos Theodorou

推荐理由：将深度神经网络(Deep Neural Networks，DNNs)训练解释为一个非线性动态系统的最优控制问题，近来受到了相当大的关注。

在这项工作中，作者沿着这一思路进行了尝试，从轨迹优化的角度对训练过程进行了重构。在该工作中，大多数广泛使用的DNNs训练算法都可以与微分动态编程（Differential Dynamic Programming，DDP）联系起来，DDP是一种根植于近似动态编程的著名二阶方法。

为此，作者提出了一类新的优化器，即DDP神经优化器（DDP Neural Optimizer，DDPNOpt），用于训练前馈和卷积网络。

DDPNOpt的特点是层间反馈策略，与现有的方法相比，它可以提高收敛性并降低对超参数的敏感性。它在收敛性和复杂度上都优于其他最优控制启发的训练方法，并且与最先进的一阶和二阶方法相比具有竞争力。该工作还观察到DDPNOpt在防止梯度消失方面有惊人的优势。

该工作为建立在最优控制理论基础上的原则性算法设计开辟了新的途径。

图片

成为VIP会员查看完整内容

相关内容

深度学习训练

关注 4

【ICLR2021】对未标记数据进行深度网络自训练的理论分析

专知会员服务

26+阅读 · 2021年2月22日

【AAAI2021】近似梯度下降的学习图神经网络

专知会员服务

20+阅读 · 2020年12月9日

【NeurIPS2020】迭代深度图学习的图神经网络:更好和鲁棒的节点嵌入

专知会员服务

31+阅读 · 2020年9月30日

【NeurIPS2020】梯度增强的转导优化和泛化分析及在多尺度图神经网络中的应用

专知会员服务

14+阅读 · 2020年9月27日

注意力图神经网络的小样本学习

专知会员服务

192+阅读 · 2020年7月16日

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知

75+阅读 · 2020年6月29日

面试题：人工神经网络中为什么ReLu要好过于tanh和sigmoid？

七月在线实验室

6+阅读 · 2019年6月11日

田渊栋博士:求道之人，不问寒暑—理解ReLU深度网络训练动态

极市平台

7+阅读 · 2019年6月5日

【学科发展报告】自适应动态规划

中国自动化学会

24+阅读 · 2018年9月14日

Dynamic Weights in Gaussian Mixture Models: A Bayesian Approach

Arxiv

0+阅读 · 2021年4月23日

Differential Dynamic Programming Neural Optimizer

Arxiv

7+阅读 · 2020年6月29日

Neural Ordinary Differential Equations

Arxiv

6+阅读 · 2018年10月3日

Neural-Brane: Neural Bayesian Personalized Ranking for Attributed Network Embedding

Arxiv

4+阅读 · 2018年4月23日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

VIP会员