本课程关注控制理论和强化学习的理论介绍,侧重于连续状态空间以及物理世界和机器人技术的应用。我们强调计算效率的算法和可证明的界。特别关注RL中非随机控制和遗憾最小化的新方法。我们将与该领域的经典方法论进行比较和对比。

本课程的练习和项目将需要用python编写代码。

这门课程对所有学生开放,但要求有很强的数学背景。

https://sites.google.com/view/cos59x-cct/home

深度学习的先驱、图灵奖获得者Yann Lecun教授有一种非常简洁明了地抓住问题症结的气质。2020年2月左右,他在巴巴多斯研讨会上说,

“控制=梯度强化学习”。

强化学习和控制理论的关键区别在于它们所操作的空间。强化学习的范围通常位于离散状态空间(如围棋、国际象棋),而控制理论通常处理涉及物理和连续空间(如机器人)的问题。物理学和结构环境的知识使我们能够利用差分信息。

后者允许我们使用强大的数学优化和凸松弛技术来设计高效的算法。这是自适应非随机控制理论的主题,也是本课程的主题。

成为VIP会员查看完整内容
52

相关内容

最新《深度学习理论》笔记,68页pdf
专知会员服务
49+阅读 · 2021年2月14日
港中文《深度学习导论》2021课程,李鴻升老师讲授
专知会员服务
50+阅读 · 2021年1月21日
【布朗大学David Abel博士论文】强化学习抽象理论,297页pdf
【2020新书】傅里叶变换的离散代数,296页pdf
专知会员服务
113+阅读 · 2020年11月2日
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
67+阅读 · 2020年9月27日
《常微分方程》笔记,419页pdf
专知会员服务
71+阅读 · 2020年8月2日
耶鲁大学《分布式系统理论》笔记,491页pdf
专知会员服务
44+阅读 · 2020年7月29日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
228+阅读 · 2020年5月2日
关于强化学习(附代码,练习和解答)
深度学习
36+阅读 · 2018年1月30日
Arxiv
0+阅读 · 2021年2月26日
Arxiv
5+阅读 · 2017年10月27日
Arxiv
9+阅读 · 2016年10月27日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关VIP内容
最新《深度学习理论》笔记,68页pdf
专知会员服务
49+阅读 · 2021年2月14日
港中文《深度学习导论》2021课程,李鴻升老师讲授
专知会员服务
50+阅读 · 2021年1月21日
【布朗大学David Abel博士论文】强化学习抽象理论,297页pdf
【2020新书】傅里叶变换的离散代数,296页pdf
专知会员服务
113+阅读 · 2020年11月2日
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
67+阅读 · 2020年9月27日
《常微分方程》笔记,419页pdf
专知会员服务
71+阅读 · 2020年8月2日
耶鲁大学《分布式系统理论》笔记,491页pdf
专知会员服务
44+阅读 · 2020年7月29日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
228+阅读 · 2020年5月2日
微信扫码咨询专知VIP会员