We study the temperature control problem for Langevin diffusions in the context of non-convex optimization. The classical optimal control of such a problem is of the bang-bang type, which is overly sensitive to errors. A remedy is to allow the diffusions to explore other temperature values and hence smooth out the bang-bang control. We accomplish this by a stochastic relaxed control formulation incorporating randomization of the temperature control and regularizing its entropy. We derive a state-dependent, truncated exponential distribution, which can be used to sample temperatures in a Langevin algorithm, in terms of the solution to an HJB partial differential equation. We carry out a numerical experiment on a one-dimensional baseline example, in which the HJB equation can be easily solved, to compare the performance of the algorithm with three other available algorithms in search of a global optimum.


翻译:我们从非电流优化的角度研究Langevin扩散的温度控制问题。 这一问题的典型最佳控制方式是爆炸性爆炸型,对错误过于敏感。 一种补救措施是允许扩散探索其他温度值,从而平滑爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性的爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸性爆炸。

0
下载
关闭预览

相关内容

牛津大学最新《计算代数拓扑》笔记书,107页pdf
专知会员服务
43+阅读 · 2022年2月17日
【干货书】金融数学概念和计算方法的导论,290页pdf
专知会员服务
64+阅读 · 2020年11月16日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
79+阅读 · 2020年7月26日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
111+阅读 · 2020年5月15日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
spinningup.openai 强化学习资源完整
CreateAMind
6+阅读 · 2018年12月17日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
0+阅读 · 2022年2月21日
Arxiv
0+阅读 · 2022年2月21日
Arxiv
8+阅读 · 2021年5月21日
Arxiv
5+阅读 · 2018年4月22日
VIP会员
相关资讯
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
spinningup.openai 强化学习资源完整
CreateAMind
6+阅读 · 2018年12月17日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Top
微信扫码咨询专知VIP会员