基于模型的强化学习探索了一种全面而实用的强化学习方法。

强化学习是机器学习的一种基本范式,其中智能体执行动作以确保设备的最佳行为。虽然这种机器学习范式近年来获得了巨大的成功和普及,但之前的学术要么专注于理论最优控制和动态规划,要么专注于算法,其中大多数是基于仿真的。

https://www.wiley.com/en-us/Model+Based+Reinforcement+Learning%3A+From+Data+to+Continuous+Actions+with+a+Python+based+Toolbox-p-9781119808572

基于模型的强化学习提供了一个基于模型的框架来连接这两个方面,从而创建一个整体的处理基于模型的在线学习控制的主题。在这样做的过程中,作者试图为数据驱动控制开发一个基于模型的框架,将从数据中识别系统、基于模型的强化学习和最优控制等主题以及它们的应用联系起来。这种评估经典结果的新技术将允许更有效的强化学习系统。本书的核心是提供一个端到端的框架——从设计到应用,更易于处理的基于模型的强化学习技术。

基于模型的强化学习读者还会发现:

在数据驱动和基于学习的控制的研究生课程中使用的有用教科书,强调从数据建立动态系统的建模和控制 详细比较不同技术的影响,如基本线性二次控制器、基于学习的模型预测控制、无模型强化学习和结构化在线学习

非完整动力学地面车辆和四足直升机的应用和案例研究 一个基于python的在线工具箱,与本书的内容以及必要的代码和数据配套使用 基于模型的强化学习是大四本科生、研究生、研究助理、教授、过程控制工程师和机器人专家的有用参考。

成为VIP会员查看完整内容
61

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【干货书】强化学习Python真实数据与实例应用,110页pdf
专知会员服务
110+阅读 · 2022年10月13日
【干货书】现代统计学:使用Python的计算机方法,452页pdf
专知会员服务
120+阅读 · 2022年9月28日
【干货书】Python中的数据结构和算法,928页pdf
专知会员服务
108+阅读 · 2022年9月25日
【实用书】强化学习实战:Python,110页pdf
专知会员服务
144+阅读 · 2022年6月9日
【干货书】利用 Python 进行数据分析,470页pdf
专知会员服务
109+阅读 · 2021年3月13日
【干货书】Python 编程,480页pdf
专知会员服务
228+阅读 · 2020年8月14日
专知会员服务
165+阅读 · 2020年6月4日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
280+阅读 · 2020年6月3日
Python导论,476页pdf,现代Python计算
专知会员服务
253+阅读 · 2020年5月17日
【实用书】强化学习实战:Python,110页pdf
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2023年2月21日
Arxiv
0+阅读 · 2023年2月20日
Arxiv
0+阅读 · 2023年2月18日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
VIP会员
相关VIP内容
【干货书】强化学习Python真实数据与实例应用,110页pdf
专知会员服务
110+阅读 · 2022年10月13日
【干货书】现代统计学:使用Python的计算机方法,452页pdf
专知会员服务
120+阅读 · 2022年9月28日
【干货书】Python中的数据结构和算法,928页pdf
专知会员服务
108+阅读 · 2022年9月25日
【实用书】强化学习实战:Python,110页pdf
专知会员服务
144+阅读 · 2022年6月9日
【干货书】利用 Python 进行数据分析,470页pdf
专知会员服务
109+阅读 · 2021年3月13日
【干货书】Python 编程,480页pdf
专知会员服务
228+阅读 · 2020年8月14日
专知会员服务
165+阅读 · 2020年6月4日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
280+阅读 · 2020年6月3日
Python导论,476页pdf,现代Python计算
专知会员服务
253+阅读 · 2020年5月17日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员