The backwards induction method due to Bellman~\cite{bellman1952theory} is a popular approach to solving problems in optimiztion, optimal control, and many other areas of applied math. In this paper we analyze the backwords induction approach, under min/max conditions. We show that if the value function is has strictly positive derivatives of order 1-4 then the optimal strategy for the adversary is Brownian motion. Using that fact we analyze different potential functions and show that the Normal-Hedge potential is optimal.


翻译:Bellman ⁇ cite{bellman{bellman1952theory} 的后向上岗方法是一种解决优化、最佳控制和许多其他应用数学领域问题的流行方法。 在本文中,我们分析了在分钟/最大条件下的后文上岗方法。 我们显示,如果价值函数具有第1-4号命令的绝对正衍生物,那么对手的最佳策略就是布朗运动。 我们利用这一事实分析不同的潜在功能,并显示正常- 隐藏潜力是最佳的。

0
下载
关闭预览

相关内容

专知会员服务
50+阅读 · 2020年12月14日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【2020新书】图机器学习,Graph-Powered Machine Learning
专知会员服务
339+阅读 · 2020年1月27日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
小样本学习(Few-shot Learning)综述
机器之心
18+阅读 · 2019年4月1日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
【推荐】用Python/OpenCV实现增强现实
机器学习研究会
14+阅读 · 2017年11月16日
Arxiv
1+阅读 · 2022年1月27日
Arxiv
22+阅读 · 2021年12月19日
Arxiv
11+阅读 · 2020年12月2日
Arxiv
4+阅读 · 2020年1月17日
Arxiv
5+阅读 · 2018年6月12日
VIP会员
相关资讯
相关论文
Arxiv
1+阅读 · 2022年1月27日
Arxiv
22+阅读 · 2021年12月19日
Arxiv
11+阅读 · 2020年12月2日
Arxiv
4+阅读 · 2020年1月17日
Arxiv
5+阅读 · 2018年6月12日
Top
微信扫码咨询专知VIP会员