The Polyak-Lojasiewicz (PL) inequality is a sufficient condition for establishing linear convergence of gradient descent, even in non-convex settings. While several recent works use a PL-based analysis to establish linear convergence of stochastic gradient descent methods, the question remains as to whether a similar analysis can be conducted for more general optimization methods. In this work, we present a PL-based analysis for linear convergence of generalized mirror descent (GMD), a generalization of mirror descent with a possibly time-dependent mirror. GMD subsumes popular first order optimization methods including gradient descent, mirror descent, and preconditioned gradient descent methods such as Adagrad. Since the standard PL analysis cannot be extended naturally from GMD to stochastic GMD, we present a Taylor-series based analysis to establish sufficient conditions for linear convergence of stochastic GMD. As a corollary, our result establishes sufficient conditions and provides learning rates for linear convergence of stochastic mirror descent and Adagrad. Lastly, for functions that are locally PL*, our analysis implies existence of an interpolating solution and convergence of GMD to this solution.


翻译:Polyak-Lojasiewicz(PL)不平等是确定梯度下降线性趋同的充足条件,即使在非混凝土环境中也是如此。虽然最近的一些工作利用基于PL的分析来确定随机梯度下降方法的线性趋同,但问题仍然是,是否可以为更普遍的优化方法进行类似的分析。在这项工作中,我们提出了基于PL的分析,以确定普遍镜面下降线性趋同(GMD),将镜面下降法普遍化,并视时间而定。GMD子集成流行的第一顺序优化方法,包括梯度下降、镜位下降和Adagrad等有先决条件的梯度下降方法。由于标准的PL分析不能自然地从GMD扩大到Stochacistic GD,我们提出了基于泰勒系列的分析,以便为随机镜面下降的线性融合创造充分的条件。作为推论,我们的结果为随机镜系和Adagrad的线性融合提供了足够的条件和学习率。最后,对于当地PL* 的功能,我们的分析意味着存在一种内插解决办法和GMD的趋同这一解决办法。

0
下载
关闭预览

相关内容

专知会员服务
51+阅读 · 2020年12月14日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
111+阅读 · 2020年5月15日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
31+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
104+阅读 · 2019年10月9日
已删除
将门创投
5+阅读 · 2019年4月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Arxiv
0+阅读 · 2021年11月26日
Arxiv
0+阅读 · 2021年11月25日
Arxiv
3+阅读 · 2019年10月31日
VIP会员
相关资讯
已删除
将门创投
5+阅读 · 2019年4月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Top
微信扫码咨询专知VIP会员