最新《计算控制理论》笔记与课程，60页pdf

本课程关注控制理论和强化学习的理论介绍，侧重于连续状态空间以及物理世界和机器人技术的应用。我们强调计算效率的算法和可证明的界。特别关注RL中非随机控制和遗憾最小化的新方法。我们将与该领域的经典方法论进行比较和对比。

本课程的练习和项目将需要用python编写代码。

这门课程对所有学生开放，但要求有很强的数学背景。

https://sites.google.com/view/cos59x-cct/home

深度学习的先驱、图灵奖获得者Yann Lecun教授有一种非常简洁明了地抓住问题症结的气质。2020年2月左右，他在巴巴多斯研讨会上说，

“控制=梯度强化学习”。

强化学习和控制理论的关键区别在于它们所操作的空间。强化学习的范围通常位于离散状态空间(如围棋、国际象棋)，而控制理论通常处理涉及物理和连续空间(如机器人)的问题。物理学和结构环境的知识使我们能够利用差分信息。

后者允许我们使用强大的数学优化和凸松弛技术来设计高效的算法。这是自适应非随机控制理论的主题，也是本课程的主题。

成为VIP会员查看完整内容

相关内容

计算控制理论

关注 3

最新《深度学习理论》笔记，68页pdf

专知会员服务

50+阅读 · 2021年2月14日

《算法》课件视频以及第四版书籍，普林斯顿经典课程，附969页pdf

专知会员服务

121+阅读 · 2021年1月4日

【2020新书】傅里叶变换的离散代数，296页pdf

专知会员服务

118+阅读 · 2020年11月2日

《常微分方程》笔记，419页pdf

专知会员服务

76+阅读 · 2020年8月2日

耶鲁大学《分布式系统理论》笔记，491页pdf

专知会员服务

46+阅读 · 2020年7月29日

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

专知

37+阅读 · 2019年11月30日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

数据派THU

17+阅读 · 2018年9月23日

深度学习贝叶斯，这是一份密集的6天速成课程（视频与PPT）

全球人工智能

7+阅读 · 2018年9月7日

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

Show, Control and Tell: A Framework for Generating Controllable and Grounded Captions

Arxiv

4+阅读 · 2018年11月26日

From VQA to Multimodal CQA: Adapting Visual QA Models for Community QA Tasks

Arxiv

8+阅读 · 2018年8月29日

Two can play this Game: Visual Dialog with Discriminative Question Generation and Answering

Arxiv

8+阅读 · 2018年3月29日

One-shot and few-shot learning of word embeddings

Arxiv

5+阅读 · 2017年10月27日

VQA: Visual Question Answering

Arxiv

9+阅读 · 2016年10月27日