ICML2018强化学习部分总结(1)

2018 年 7 月 22 日 深度强化学习实验室

最近由于个人比较忙的原因,文章更新速度有点慢,还望大家谅解!今天主要分享一下前沿动态,不更新算法讲解!


人工智能的发展方向,基本可以从每年顶会(ICML, NPIS, CVPR)上可以看出,今年ICML于7月10号在著名的瑞典斯德哥尔摩举行,说起斯德哥尔摩,唯一能让我想起的就是"斯德哥尔摩综合征",自行google. 下面进入主题.


本文是根据David Abel 的笔进行整理,原英文见文末引用, ICML中关于RL的内容在第2,3,4,6天,

(1)基于模型的RL救援(Model-Based RL To The Rescue)

主要思路:收集一些模拟数据,应该有

一个想法是通过监督学习来适应动态:

然后,解决近似问题,与LQR相同,但使用φ作为模型。

这里的难点是我们解决的控制问题是什么? 我们知道我们的模型并不完美。 从而

我们需要像Robust Control / Coarse-ID控制这样的东西。

在Coarse-ID控制中:

• 解决的影响,B未知。

• 然后,收集数据:

• 估计B:

• 估计

然后,我们可以将其转换为强大的优化问题:

受x = Bu + x0的影响。 然后我们可以通过三角不等式将其放宽到一个凸问题:

受同样的约束。 他们展示了如何将估计误差转换为LQR系统中的控制误差 - 有点像来自Yields基于稳健模型的控制的模拟引理:显示了一些实验结果,一直很好(肯定比无模型更好)。

回归线性化原则:现在,当我们消除线性时会发生什么?(QR?)。 他们尝试在MuJocoo上运行随机搜索算法,并发现它做得更好(或至少同样好)的自然灰度法和TRPO。 Bens'提出的前进方向:使用模型。 特别是模型预测控制(MPC):

想法:计划在短时间内,获得反馈,重新计划。

结论和剩下要做的事情:

• 粗ID结果是否最佳? 甚至w.r.t. 问题参数?

• 我们能否针对各种控制问题获得紧张和较低的样本复杂性?

• 自适应和迭代学习控制

• 非线性模型,约束和不正确的学习。

• 安全探索,了解不确定的环境。

所以,有很多令人兴奋的事情要做! 而且不只是RL而不仅仅是控制理论。 也许我们需要一个更具包容性的新名称,如“Actionable Intelligence”。 所以,得出结论:



本部分完,

这是原作者英文版,地址:https://pan.baidu.com/s/1R8LtR262FKoHOSrXTj4f2Q,密码:jz9z


顺便问一下,谁知道公众号怎么输入公式,不能输入公式太烦了,麻烦请私信!

登录查看更多
0

相关内容

ICML 是 International Conference on Machine Learning的缩写,即国际机器学习大会。ICML如今已发展为由国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议。
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
126+阅读 · 2020年7月20日
《强化学习》简介小册,24页pdf
专知会员服务
272+阅读 · 2020年4月19日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
103+阅读 · 2020年3月2日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
强化学习扫盲贴:从Q-learning到DQN
夕小瑶的卖萌屋
52+阅读 · 2019年10月13日
最严强化学习打卡群
CreateAMind
4+阅读 · 2019年1月16日
强化学习的未来——第一部分
AI研习社
9+阅读 · 2019年1月2日
【ICML2018】63篇强化学习论文全解读
专知
7+阅读 · 2018年7月24日
【干货】强化学习介绍
专知
12+阅读 · 2018年6月24日
干货|浅谈强化学习的方法及学习路线
机器学习算法与Python学习
16+阅读 · 2018年3月28日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
7+阅读 · 2018年6月8日
Arxiv
8+阅读 · 2018年5月15日
VIP会员
相关资讯
强化学习扫盲贴:从Q-learning到DQN
夕小瑶的卖萌屋
52+阅读 · 2019年10月13日
最严强化学习打卡群
CreateAMind
4+阅读 · 2019年1月16日
强化学习的未来——第一部分
AI研习社
9+阅读 · 2019年1月2日
【ICML2018】63篇强化学习论文全解读
专知
7+阅读 · 2018年7月24日
【干货】强化学习介绍
专知
12+阅读 · 2018年6月24日
干货|浅谈强化学习的方法及学习路线
机器学习算法与Python学习
16+阅读 · 2018年3月28日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
相关论文
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
7+阅读 · 2018年6月8日
Arxiv
8+阅读 · 2018年5月15日
Top
微信扫码咨询专知VIP会员