最新《计算控制理论》笔记与课程,60页pdf

2020 年 12 月 24 日 专知

本课程关注控制理论和强化学习的理论介绍,侧重于连续状态空间以及物理世界和机器人技术的应用。我们强调计算效率的算法和可证明的界。特别关注RL中非随机控制和遗憾最小化的新方法。我们将与该领域的经典方法论进行比较和对比。


本课程的练习和项目将需要用python编写代码。


这门课程对所有学生开放,但要求有很强的数学背景。


https://sites.google.com/view/cos59x-cct/home


深度学习的先驱、图灵奖获得者Yann Lecun教授有一种非常简洁明了地抓住问题症结的气质。2020年2月左右,他在巴巴多斯研讨会上说,


“控制=梯度强化学习”。


强化学习和控制理论的关键区别在于它们所操作的空间。强化学习的范围通常位于离散状态空间(如围棋、国际象棋),而控制理论通常处理涉及物理和连续空间(如机器人)的问题。物理学和结构环境的知识使我们能够利用差分信息。


后者允许我们使用强大的数学优化和凸松弛技术来设计高效的算法。这是自适应非随机控制理论的主题,也是本课程的主题。





专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“CCT” 可以获取《最新《计算控制理论》笔记与课程,60页pdf》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
122+阅读 · 2021年3月30日
最新《深度学习理论》笔记,68页pdf
专知会员服务
49+阅读 · 2021年2月14日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
耶鲁大学《分布式系统理论》笔记,491页pdf
专知会员服务
44+阅读 · 2020年7月29日
专知会员服务
163+阅读 · 2020年7月27日
【2020新书】现代C++初学者指南,301页pdf
专知会员服务
159+阅读 · 2020年7月24日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
351+阅读 · 2020年6月24日
【纽约大学】最新《离散数学》笔记,451页pdf
专知会员服务
128+阅读 · 2020年5月26日
机器学习速查手册,135页pdf
专知会员服务
338+阅读 · 2020年3月15日
最新《图理论》笔记书,98页pdf
专知
51+阅读 · 2020年12月27日
【干货书】计算机科学离散数学,627页pdf
专知
60+阅读 · 2020年8月31日
Arxiv
7+阅读 · 2020年3月1日
Arxiv
3+阅读 · 2020年2月12日
Hardness-Aware Deep Metric Learning
Arxiv
6+阅读 · 2019年3月13日
Residual Policy Learning
Arxiv
4+阅读 · 2018年12月15日
Deformable ConvNets v2: More Deformable, Better Results
Arxiv
6+阅读 · 2018年11月1日
Arxiv
26+阅读 · 2018年8月19日
Arxiv
3+阅读 · 2017年7月6日
VIP会员
相关VIP内容
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
122+阅读 · 2021年3月30日
最新《深度学习理论》笔记,68页pdf
专知会员服务
49+阅读 · 2021年2月14日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
耶鲁大学《分布式系统理论》笔记,491页pdf
专知会员服务
44+阅读 · 2020年7月29日
专知会员服务
163+阅读 · 2020年7月27日
【2020新书】现代C++初学者指南,301页pdf
专知会员服务
159+阅读 · 2020年7月24日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
351+阅读 · 2020年6月24日
【纽约大学】最新《离散数学》笔记,451页pdf
专知会员服务
128+阅读 · 2020年5月26日
机器学习速查手册,135页pdf
专知会员服务
338+阅读 · 2020年3月15日
相关论文
Arxiv
7+阅读 · 2020年3月1日
Arxiv
3+阅读 · 2020年2月12日
Hardness-Aware Deep Metric Learning
Arxiv
6+阅读 · 2019年3月13日
Residual Policy Learning
Arxiv
4+阅读 · 2018年12月15日
Deformable ConvNets v2: More Deformable, Better Results
Arxiv
6+阅读 · 2018年11月1日
Arxiv
26+阅读 · 2018年8月19日
Arxiv
3+阅读 · 2017年7月6日
Top
微信扫码咨询专知VIP会员