【CMU硬核书】现代自适应控制与强化学习，166页pdf - 专知

会员服务 ·

0

【CMU硬核书】现代自适应控制与强化学习，166页pdf

2022 年 8 月 30 日 专知

这本书是对卡内基梅隆大学Drew Bagnell在自适应控制和强化学习课程(2010,11,14)，Byron Boots在佐治亚理工大学(2019)和Sanjiban Choudhury在康奈尔大学(2022)所做课堂笔记的编辑合集。我们感谢Chris Atkeson共同讲授了这门课的第一个实例，并塑造了我们在这里思考问题的方式。这本书——以及它所依据的类——旨在提供一套实用工具，为机器与世界的交互构建决策程序。我们的应用程序从视频游戏和网络搜索到机器人操作和自动驾驶汽车。这个领域是广阔的，所以我们的观点必然是狭隘的。我们明确地不做严格的尝试，而是专注于直觉和建立这种直觉的非正式数学论证，以及我们在艰难的决策问题上多次看到的技术。我们试图概括出我们在实践中最有可能采用的技术和思维方式。在整个过程中，我们试图指出严格的衍生和原始文献的主题。这些笔记的设计基于概率的基本技术(条件概率、条件独立、高斯、积分技术、贝叶斯方法和推断、滤波和时间序列模型)、线性代数(计算和基本线性分析)、优化(梯度、Hessians、度量、Krylov子空间)和机器学习(泛化、优化、无后悔/在线学习、反向传播和核方法)。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“ACRL” 就可以获取《现代自适应控制与强化学习，166页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

4

相关内容

适应控制

【硬核书】多智能体协调:强化学习方法，315页pdf

【硬核书】多智能体协调:强化学习方法，315页pdf

专知会员服务

159+阅读 · 2022年9月17日

【CMU硬核书】数理逻辑与计算，526页pdf

【CMU硬核书】数理逻辑与计算，526页pdf

专知会员服务

108+阅读 · 2022年9月14日

现代自适应控制与强化学习，166页pdf

现代自适应控制与强化学习，166页pdf

专知会员服务

110+阅读 · 2022年8月30日

【硬核书】量子信息理论，598页pdf

专知会员服务

127+阅读 · 2021年8月4日

机器学习简明导论，62页pdf

专知会员服务

83+阅读 · 2021年7月31日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【干货书】机器学习优化，509页pdf

【干货书】机器学习优化，509页pdf

专知会员服务

150+阅读 · 2021年2月26日

现代机器学习技术导论，596页pdf

专知会员服务

168+阅读 · 2020年7月27日

【硬核书】不完全信息决策理论，467页pdf

【硬核书】不完全信息决策理论，467页pdf

专知会员服务

363+阅读 · 2020年6月24日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

232+阅读 · 2020年4月28日

【2022新书】强化学习基础及其在金融中的应用，522页pdf

【2022新书】强化学习基础及其在金融中的应用，522页pdf

专知

10+阅读 · 2022年11月6日

【伯克利Jitendra Malik】基于深度强化学习的自适应控制，及其在机器人技术中应用

【伯克利Jitendra Malik】基于深度强化学习的自适应控制，及其在机器人技术中应用

专知

1+阅读 · 2022年11月6日

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

专知

9+阅读 · 2022年10月25日

【硬核书】数学和Python机器学习的核心方法:构建逻辑的100个练习，216页pdf

【硬核书】数学和Python机器学习的核心方法:构建逻辑的100个练习，216页pdf

专知

17+阅读 · 2022年10月2日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知

4+阅读 · 2022年9月20日

【硬核书】多智能体协调:强化学习方法，315页pdf

【硬核书】多智能体协调:强化学习方法，315页pdf

专知

4+阅读 · 2022年9月17日

【CMU池跃洁等硬核书】满足低秩矩阵分解的非凸优化综述，69页pdf

【CMU池跃洁等硬核书】满足低秩矩阵分解的非凸优化综述，69页pdf

专知

3+阅读 · 2022年3月4日

《机器学习》简明导论，21页pdf

《机器学习》简明导论，21页pdf

专知

5+阅读 · 2022年3月3日

【干货书】统计基础、推理与推断，361页pdf

【干货书】统计基础、推理与推断，361页pdf

专知

10+阅读 · 2022年1月25日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

基于模糊逻辑的大规模强化学习理论及方法

国家自然科学基金

7+阅读 · 2014年12月31日

控制方向未知的随机非线性系统的神经网络自适应控制

国家自然科学基金

2+阅读 · 2013年12月31日

大规模新能源并网系统概率1稳定的自适应控制策略研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于三角直觉模糊数的多属性群决策理论与方法及其应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

具有不确定性信息的一分类和多分类算法的研究

国家自然科学基金

2+阅读 · 2012年12月31日

不确定环境下基于证据理论的多属性信息融合路径寻优研究

国家自然科学基金

0+阅读 · 2012年12月31日

不确定随机非线性系统的自适应动态面控制研究

国家自然科学基金

0+阅读 · 2011年12月31日

归纳学习中的不确定性研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于在线模糊聚类与闭环模糊辨识的非线性系统智能容错控制

国家自然科学基金

0+阅读 · 2009年12月31日

对偶自适应控制问题研究

国家自然科学基金

0+阅读 · 2008年12月31日

Introspection-based Explainable Reinforcement Learning in Episodic and Non-episodic Scenarios

Arxiv

0+阅读 · 2022年11月23日

Improving Robust Generalization by Direct PAC-Bayesian Bound Minimization

Arxiv

0+阅读 · 2022年11月22日

Can denoising diffusion probabilistic models generate realistic astrophysical fields?

Arxiv

0+阅读 · 2022年11月22日

Off-policy Reinforcement Learning with Optimistic Exploration and Distribution Correction

Arxiv

0+阅读 · 2022年11月22日

A Cut-Matching Game for Constant-Hop Expanders

Arxiv

0+阅读 · 2022年11月21日

Near-Optimal Sample Complexity Bounds for Constrained MDPs

Arxiv

0+阅读 · 2022年11月19日

Novelpy: A Python package to measure novelty and disruptiveness of bibliometric and patent data

Novelpy: A Python package to measure novelty and disruptiveness of bibliometric and patent data

Arxiv

0+阅读 · 2022年11月18日

Model Complexity of Deep Learning: A Survey

Arxiv

32+阅读 · 2021年3月8日

已删除

Arxiv

32+阅读 · 2020年3月23日

Cross-Domain Image Matching with Deep Feature Maps

Arxiv

14+阅读 · 2018年4月6日

VIP会员

相关主题

自适应控制

相关VIP内容

【硬核书】多智能体协调:强化学习方法，315页pdf

【硬核书】多智能体协调:强化学习方法，315页pdf

专知会员服务

159+阅读 · 2022年9月17日

【CMU硬核书】数理逻辑与计算，526页pdf

【CMU硬核书】数理逻辑与计算，526页pdf

专知会员服务

108+阅读 · 2022年9月14日

现代自适应控制与强化学习，166页pdf

现代自适应控制与强化学习，166页pdf

专知会员服务

110+阅读 · 2022年8月30日

【硬核书】量子信息理论，598页pdf

专知会员服务

127+阅读 · 2021年8月4日

机器学习简明导论，62页pdf

专知会员服务

83+阅读 · 2021年7月31日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【干货书】机器学习优化，509页pdf

【干货书】机器学习优化，509页pdf

专知会员服务

150+阅读 · 2021年2月26日

现代机器学习技术导论，596页pdf

专知会员服务

168+阅读 · 2020年7月27日

【硬核书】不完全信息决策理论，467页pdf

【硬核书】不完全信息决策理论，467页pdf

专知会员服务

363+阅读 · 2020年6月24日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

232+阅读 · 2020年4月28日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

【2022新书】强化学习基础及其在金融中的应用，522页pdf

【2022新书】强化学习基础及其在金融中的应用，522页pdf

专知

10+阅读 · 2022年11月6日

【伯克利Jitendra Malik】基于深度强化学习的自适应控制，及其在机器人技术中应用

【伯克利Jitendra Malik】基于深度强化学习的自适应控制，及其在机器人技术中应用

专知

1+阅读 · 2022年11月6日

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

专知

9+阅读 · 2022年10月25日

【硬核书】数学和Python机器学习的核心方法:构建逻辑的100个练习，216页pdf

【硬核书】数学和Python机器学习的核心方法:构建逻辑的100个练习，216页pdf

专知

17+阅读 · 2022年10月2日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知

4+阅读 · 2022年9月20日

【硬核书】多智能体协调:强化学习方法，315页pdf

【硬核书】多智能体协调:强化学习方法，315页pdf

专知

4+阅读 · 2022年9月17日

【CMU池跃洁等硬核书】满足低秩矩阵分解的非凸优化综述，69页pdf

【CMU池跃洁等硬核书】满足低秩矩阵分解的非凸优化综述，69页pdf

专知

3+阅读 · 2022年3月4日

《机器学习》简明导论，21页pdf

《机器学习》简明导论，21页pdf

专知

5+阅读 · 2022年3月3日

【干货书】统计基础、推理与推断，361页pdf

【干货书】统计基础、推理与推断，361页pdf

专知

10+阅读 · 2022年1月25日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

相关基金

基于模糊逻辑的大规模强化学习理论及方法

国家自然科学基金

7+阅读 · 2014年12月31日

控制方向未知的随机非线性系统的神经网络自适应控制

国家自然科学基金

2+阅读 · 2013年12月31日

大规模新能源并网系统概率1稳定的自适应控制策略研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于三角直觉模糊数的多属性群决策理论与方法及其应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

具有不确定性信息的一分类和多分类算法的研究

国家自然科学基金

2+阅读 · 2012年12月31日

不确定环境下基于证据理论的多属性信息融合路径寻优研究

国家自然科学基金

0+阅读 · 2012年12月31日

不确定随机非线性系统的自适应动态面控制研究

国家自然科学基金

0+阅读 · 2011年12月31日

归纳学习中的不确定性研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于在线模糊聚类与闭环模糊辨识的非线性系统智能容错控制

国家自然科学基金

0+阅读 · 2009年12月31日

对偶自适应控制问题研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Introspection-based Explainable Reinforcement Learning in Episodic and Non-episodic Scenarios

Arxiv

0+阅读 · 2022年11月23日

Improving Robust Generalization by Direct PAC-Bayesian Bound Minimization

Arxiv

0+阅读 · 2022年11月22日

Can denoising diffusion probabilistic models generate realistic astrophysical fields?

Arxiv

0+阅读 · 2022年11月22日

Off-policy Reinforcement Learning with Optimistic Exploration and Distribution Correction

Arxiv

0+阅读 · 2022年11月22日

A Cut-Matching Game for Constant-Hop Expanders

Arxiv

0+阅读 · 2022年11月21日

Near-Optimal Sample Complexity Bounds for Constrained MDPs

Arxiv

0+阅读 · 2022年11月19日

Novelpy: A Python package to measure novelty and disruptiveness of bibliometric and patent data

Novelpy: A Python package to measure novelty and disruptiveness of bibliometric and patent data

Arxiv

0+阅读 · 2022年11月18日

Model Complexity of Deep Learning: A Survey

Arxiv

32+阅读 · 2021年3月8日

已删除

Arxiv

32+阅读 · 2020年3月23日

Cross-Domain Image Matching with Deep Feature Maps

Arxiv

14+阅读 · 2018年4月6日

大家都在搜

CMU博士论文

无人机集群

久别重逢话双塔

国防科技创新

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员