加速对元件进行非电流优化的一阶加速法 (An accelerated first-order method for non-convex optimization on manifolds) - 专知论文

会员服务 ·

0

流形 · 代价函数 · Lipschitz · 优化器 · CASE ·

2021 年 11 月 25 日

An accelerated first-order method for non-convex optimization on manifolds

翻译：加速对元件进行非电流优化的一阶加速法

Christopher Criscitiello,Nicolas Boumal

from arxiv, 77 pages. Updated for clarity and included additional remarks/secondary theorems

We describe the first gradient methods on Riemannian manifolds to achieve accelerated rates in the non-convex case. Under Lipschitz assumptions on the Riemannian gradient and Hessian of the cost function, these methods find approximate first-order critical points faster than regular gradient descent. A randomized version also finds approximate second-order critical points. Both the algorithms and their analyses build extensively on existing work in the Euclidean case. The basic operation consists in running the Euclidean accelerated gradient descent method (appropriately safe-guarded against non-convexity) in the current tangent space, then moving back to the manifold and repeating. This requires lifting the cost function from the manifold to the tangent space, which can be done for example through the Riemannian exponential map. For this approach to succeed, the lifted cost function (called the pullback) must retain certain Lipschitz properties. As a contribution of independent interest, we prove precise claims to that effect, with explicit constants. Those claims are affected by the Riemannian curvature of the manifold, which in turn affects the worst-case complexity bounds for our optimization algorithms.

翻译：我们描述里曼尼方块的第一种梯度方法, 以在非电流情况下加速速度。在利普西茨假设里格曼梯度和成本函数的赫西安假设下, 这些方法发现大约第一阶临界点比正常梯度下降速度快。一个随机化版本还发现大约第二阶临界点。算法及其分析都广泛建立在欧几里德案例的现有工作基础上。基本操作是在当前正切空间中运行欧几里德加速梯度下降法( 以适当安全的方式防止非电流下降), 然后再回到多元和重复。这需要将成本功能从元件提升到正切空间, 这可以通过里曼指数地图进行。要取得成功, 取消成本功能( 称为拉回) 必须保留某些利普西茨的属性。作为独立利益的贡献, 我们证明对这个效果有准确的主张, 并且有明确的恒定。这些主张受到马力的里曼曲面的影响, 从而反过来影响我们最复杂程度的缩算法。

0

相关内容

【硬核书】矩阵代数基础，248页pdf

【硬核书】矩阵代数基础，248页pdf

专知会员服务

88+阅读 · 2021年12月9日

深度学习优化算法，73页ppt，Optimization Algorithms on Deep Learning

深度学习优化算法，73页ppt，Optimization Algorithms on Deep Learning

专知会员服务

135+阅读 · 2021年6月16日

ICLR 2021杰出论文奖出炉，8篇论文上榜！

专知会员服务

26+阅读 · 2021年4月2日

【2020新书】Python文本分析，104页pdf

【2020新书】Python文本分析，104页pdf

专知会员服务

100+阅读 · 2020年12月23日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

111+阅读 · 2020年5月15日

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

专知会员服务

92+阅读 · 2020年5月5日

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

Ray RLlib: Scalable 降龙十八掌

Ray RLlib: Scalable 降龙十八掌

CreateAMind

9+阅读 · 2018年12月28日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

Hierarchical Disentangled Representations

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

【推荐】GAN架构入门综述(资源汇总)

【推荐】GAN架构入门综述(资源汇总)

机器学习研究会

10+阅读 · 2017年9月3日

【学习】Hierarchical Softmax

【学习】Hierarchical Softmax

机器学习研究会

4+阅读 · 2017年8月6日

Auto-Encoding GAN

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

Proximal denoiser for convergent plug-and-play optimization with nonconvex regularization

Proximal denoiser for convergent plug-and-play optimization with nonconvex regularization

Arxiv

0+阅读 · 2022年1月31日

Towards Noise-adaptive, Problem-adaptive (Accelerated) Stochastic Gradient Descent

Arxiv

0+阅读 · 2022年1月30日

Homotopic Policy Mirror Descent: Policy Convergence, Implicit Regularization, and Improved Sample Complexity

Arxiv

0+阅读 · 2022年1月30日

Incrementally Stochastic and Accelerated Gradient Information mixed Optimization for Manipulator Motion Planning

Arxiv

0+阅读 · 2022年1月29日

Universal Online Convex Optimization with Minimax Optimal Second-Order Dynamic Regret

Universal Online Convex Optimization with Minimax Optimal Second-Order Dynamic Regret

Arxiv

0+阅读 · 2022年1月28日

Adaptive Accelerated (Extra-)Gradient Methods with Variance Reduction

Adaptive Accelerated (Extra-)Gradient Methods with Variance Reduction

Arxiv

0+阅读 · 2022年1月28日

Improved Overparametrization Bounds for Global Convergence of Stochastic Gradient Descent for Shallow Neural Networks

Arxiv

0+阅读 · 2022年1月28日

Convergence of a continuous Galerkin method for mixed hyperbolic-parabolic systems

Arxiv

0+阅读 · 2022年1月28日

Restarted Nonconvex Accelerated Gradient Descent: No More Polylogarithmic Factor in the $O(ε^{-7/4})$ Complexity

Arxiv

0+阅读 · 2022年1月27日

Stochastic First-order Methods for Convex and Nonconvex Functional Constrained Optimization

Arxiv

0+阅读 · 2022年1月27日

VIP会员

文章信息

相关主题

相关VIP内容

【硬核书】矩阵代数基础，248页pdf

【硬核书】矩阵代数基础，248页pdf

专知会员服务

88+阅读 · 2021年12月9日

深度学习优化算法，73页ppt，Optimization Algorithms on Deep Learning

深度学习优化算法，73页ppt，Optimization Algorithms on Deep Learning

专知会员服务

135+阅读 · 2021年6月16日

ICLR 2021杰出论文奖出炉，8篇论文上榜！

专知会员服务

26+阅读 · 2021年4月2日

【2020新书】Python文本分析，104页pdf

【2020新书】Python文本分析，104页pdf

专知会员服务

100+阅读 · 2020年12月23日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

111+阅读 · 2020年5月15日

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

专知会员服务

92+阅读 · 2020年5月5日

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关资讯

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

Ray RLlib: Scalable 降龙十八掌

Ray RLlib: Scalable 降龙十八掌

CreateAMind

9+阅读 · 2018年12月28日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

Hierarchical Disentangled Representations

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

【推荐】GAN架构入门综述(资源汇总)

【推荐】GAN架构入门综述(资源汇总)

机器学习研究会

10+阅读 · 2017年9月3日

【学习】Hierarchical Softmax

【学习】Hierarchical Softmax

机器学习研究会

4+阅读 · 2017年8月6日

Auto-Encoding GAN

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

相关论文

Proximal denoiser for convergent plug-and-play optimization with nonconvex regularization

Proximal denoiser for convergent plug-and-play optimization with nonconvex regularization

Arxiv

0+阅读 · 2022年1月31日

Towards Noise-adaptive, Problem-adaptive (Accelerated) Stochastic Gradient Descent

Arxiv

0+阅读 · 2022年1月30日

Homotopic Policy Mirror Descent: Policy Convergence, Implicit Regularization, and Improved Sample Complexity

Arxiv

0+阅读 · 2022年1月30日

Incrementally Stochastic and Accelerated Gradient Information mixed Optimization for Manipulator Motion Planning

Arxiv

0+阅读 · 2022年1月29日

Universal Online Convex Optimization with Minimax Optimal Second-Order Dynamic Regret

Universal Online Convex Optimization with Minimax Optimal Second-Order Dynamic Regret

Arxiv

0+阅读 · 2022年1月28日

Adaptive Accelerated (Extra-)Gradient Methods with Variance Reduction

Adaptive Accelerated (Extra-)Gradient Methods with Variance Reduction

Arxiv

0+阅读 · 2022年1月28日

Improved Overparametrization Bounds for Global Convergence of Stochastic Gradient Descent for Shallow Neural Networks

Arxiv

0+阅读 · 2022年1月28日

Convergence of a continuous Galerkin method for mixed hyperbolic-parabolic systems

Arxiv

0+阅读 · 2022年1月28日

Restarted Nonconvex Accelerated Gradient Descent: No More Polylogarithmic Factor in the $O(ε^{-7/4})$ Complexity

Arxiv

0+阅读 · 2022年1月27日

Stochastic First-order Methods for Convex and Nonconvex Functional Constrained Optimization

Arxiv

0+阅读 · 2022年1月27日

微信扫码咨询专知VIP会员