【干货书】基于模型的强化学习:使用python工具箱从数据到连续动作，275页pdf - 专知VIP

会员服务 ·

34

强化学习 · 基于模型的强化学习 · Python · 书籍 ·

2022 年 12 月 21 日

【干货书】基于模型的强化学习:使用python工具箱从数据到连续动作，275页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

基于模型的强化学习探索了一种全面而实用的强化学习方法。

强化学习是机器学习的一种基本范式，其中智能体执行动作以确保设备的最佳行为。虽然这种机器学习范式近年来获得了巨大的成功和普及，但之前的学术要么专注于理论最优控制和动态规划，要么专注于算法，其中大多数是基于仿真的。

https://www.wiley.com/en-us/Model+Based+Reinforcement+Learning%3A+From+Data+to+Continuous+Actions+with+a+Python+based+Toolbox-p-9781119808572

基于模型的强化学习提供了一个基于模型的框架来连接这两个方面，从而创建一个整体的处理基于模型的在线学习控制的主题。在这样做的过程中，作者试图为数据驱动控制开发一个基于模型的框架，将从数据中识别系统、基于模型的强化学习和最优控制等主题以及它们的应用联系起来。这种评估经典结果的新技术将允许更有效的强化学习系统。本书的核心是提供一个端到端的框架——从设计到应用，更易于处理的基于模型的强化学习技术。

基于模型的强化学习读者还会发现:

在数据驱动和基于学习的控制的研究生课程中使用的有用教科书，强调从数据建立动态系统的建模和控制详细比较不同技术的影响，如基本线性二次控制器、基于学习的模型预测控制、无模型强化学习和结构化在线学习

非完整动力学地面车辆和四足直升机的应用和案例研究一个基于python的在线工具箱，与本书的内容以及必要的代码和数据配套使用基于模型的强化学习是大四本科生、研究生、研究助理、教授、过程控制工程师和机器人专家的有用参考。

成为VIP会员查看完整内容

65

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知会员服务

114+阅读 · 2022年10月13日

【干货书】现代统计学:使用Python的计算机方法，452页pdf

【干货书】现代统计学:使用Python的计算机方法，452页pdf

专知会员服务

125+阅读 · 2022年9月28日

【干货书】Python中的数据结构和算法，928页pdf

【干货书】Python中的数据结构和算法，928页pdf

专知会员服务

120+阅读 · 2022年9月25日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知会员服务

85+阅读 · 2022年8月2日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

【干货书】利用 Python 进行数据分析，470页pdf

【干货书】利用 Python 进行数据分析，470页pdf

专知会员服务

119+阅读 · 2021年3月13日

【干货书】Python 编程，480页pdf

【干货书】Python 编程，480页pdf

专知会员服务

242+阅读 · 2020年8月14日

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知会员服务

175+阅读 · 2020年6月4日

【干货书】用于概率、统计和机器学习的Python，288页pdf

【干货书】用于概率、统计和机器学习的Python，288页pdf

专知会员服务

291+阅读 · 2020年6月3日

Python导论，476页pdf，现代Python计算

Python导论，476页pdf，现代Python计算

专知会员服务

264+阅读 · 2020年5月17日

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知

9+阅读 · 2022年10月13日

【干货书】现代统计学:使用Python的计算机方法，452页pdf

【干货书】现代统计学:使用Python的计算机方法，452页pdf

专知

22+阅读 · 2022年9月28日

【干货书】Python中的数据结构和算法，928页pdf

【干货书】Python中的数据结构和算法，928页pdf

专知

21+阅读 · 2022年9月25日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知

7+阅读 · 2022年8月2日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知

9+阅读 · 2022年6月9日

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

专知

29+阅读 · 2022年5月26日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

35+阅读 · 2022年1月8日

【开放书】Python + Matplotlib可视化指南，249页pdf

【开放书】Python + Matplotlib可视化指南，249页pdf

专知

7+阅读 · 2021年11月17日

【干货书】Python机器学习导论，340页pdf数据科学家指南

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知

97+阅读 · 2020年6月4日

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

专知

27+阅读 · 2020年3月24日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

不依赖基准模型数据的钢筋混凝土梁桥多损伤阶段状态评价

国家自然科学基金

0+阅读 · 2013年12月31日

运动技能认知模型与认知机器人"感知－行动"环的形成研究

国家自然科学基金

4+阅读 · 2012年12月31日

语料标注标准的自动迁移研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂数据下联合均值与方差模型的统计推断

国家自然科学基金

1+阅读 · 2012年12月31日

用于非对称语料的语音转换函数训练算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

巨磁致伸缩材料中磁机械效应和磁致伸缩

国家自然科学基金

0+阅读 · 2012年12月31日

多维复发事件数据的统计建模及推断

国家自然科学基金

2+阅读 · 2012年12月31日

计算力学基本计算及可视化工具程序包的开发与集成

国家自然科学基金

2+阅读 · 2012年12月31日

基于机器视觉和惯性测量的轮式滑动转向移动机器人定位导航与遥感知

国家自然科学基金

0+阅读 · 2008年12月31日

SurvLIMEpy: A Python package implementing SurvLIME

Arxiv

0+阅读 · 2023年2月21日

Fast Algorithms via Dynamic-Oracle Matroids

Arxiv

0+阅读 · 2023年2月20日

MaXM: Towards Multilingual Visual Question Answering

Arxiv

0+阅读 · 2023年2月18日

Deep Reinforcement Learning for mmWave Initial Beam Alignment

Arxiv

0+阅读 · 2023年2月17日

PyRelationAL: a python library for active learning research and development

Arxiv

0+阅读 · 2023年2月17日

Deep Reinforcement Learning for Multi-Agent Interaction

Arxiv

44+阅读 · 2022年8月2日

A Survey on Deep Reinforcement Learning for Data Processing and Analytics

Arxiv

24+阅读 · 2022年2月4日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions

Arxiv

14+阅读 · 2021年9月8日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

VIP会员

相关主题

基于模型的强化学习

相关VIP内容

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知会员服务

114+阅读 · 2022年10月13日

【干货书】现代统计学:使用Python的计算机方法，452页pdf

【干货书】现代统计学:使用Python的计算机方法，452页pdf

专知会员服务

125+阅读 · 2022年9月28日

【干货书】Python中的数据结构和算法，928页pdf

【干货书】Python中的数据结构和算法，928页pdf

专知会员服务

120+阅读 · 2022年9月25日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知会员服务

85+阅读 · 2022年8月2日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

【干货书】利用 Python 进行数据分析，470页pdf

【干货书】利用 Python 进行数据分析，470页pdf

专知会员服务

119+阅读 · 2021年3月13日

【干货书】Python 编程，480页pdf

【干货书】Python 编程，480页pdf

专知会员服务

242+阅读 · 2020年8月14日

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知会员服务

175+阅读 · 2020年6月4日

【干货书】用于概率、统计和机器学习的Python，288页pdf

【干货书】用于概率、统计和机器学习的Python，288页pdf

专知会员服务

291+阅读 · 2020年6月3日

Python导论，476页pdf，现代Python计算

Python导论，476页pdf，现代Python计算

专知会员服务

264+阅读 · 2020年5月17日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能治理的未来

模态感知的特征匹配：单一模态与跨模态技术的全面综述

无监督行人重识别研究综述

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

相关资讯

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知

9+阅读 · 2022年10月13日

【干货书】现代统计学:使用Python的计算机方法，452页pdf

【干货书】现代统计学:使用Python的计算机方法，452页pdf

专知

22+阅读 · 2022年9月28日

【干货书】Python中的数据结构和算法，928页pdf

【干货书】Python中的数据结构和算法，928页pdf

专知

21+阅读 · 2022年9月25日

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

【干货书】深度强化学习Python实战:算法的简洁实现，简化数学，以及TensorFlow和PyTorch的使用，447页pdf

专知

7+阅读 · 2022年8月2日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知

9+阅读 · 2022年6月9日

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

专知

29+阅读 · 2022年5月26日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

35+阅读 · 2022年1月8日

【开放书】Python + Matplotlib可视化指南，249页pdf

【开放书】Python + Matplotlib可视化指南，249页pdf

专知

7+阅读 · 2021年11月17日

【干货书】Python机器学习导论，340页pdf数据科学家指南

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知

97+阅读 · 2020年6月4日

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

专知

27+阅读 · 2020年3月24日

相关基金

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

不依赖基准模型数据的钢筋混凝土梁桥多损伤阶段状态评价

国家自然科学基金

0+阅读 · 2013年12月31日

运动技能认知模型与认知机器人"感知－行动"环的形成研究

国家自然科学基金

4+阅读 · 2012年12月31日

语料标注标准的自动迁移研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂数据下联合均值与方差模型的统计推断

国家自然科学基金

1+阅读 · 2012年12月31日

用于非对称语料的语音转换函数训练算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

巨磁致伸缩材料中磁机械效应和磁致伸缩

国家自然科学基金

0+阅读 · 2012年12月31日

多维复发事件数据的统计建模及推断

国家自然科学基金

2+阅读 · 2012年12月31日

计算力学基本计算及可视化工具程序包的开发与集成

国家自然科学基金

2+阅读 · 2012年12月31日

基于机器视觉和惯性测量的轮式滑动转向移动机器人定位导航与遥感知

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

SurvLIMEpy: A Python package implementing SurvLIME

Arxiv

0+阅读 · 2023年2月21日

Fast Algorithms via Dynamic-Oracle Matroids

Arxiv

0+阅读 · 2023年2月20日

MaXM: Towards Multilingual Visual Question Answering

Arxiv

0+阅读 · 2023年2月18日

Deep Reinforcement Learning for mmWave Initial Beam Alignment

Arxiv

0+阅读 · 2023年2月17日

PyRelationAL: a python library for active learning research and development

Arxiv

0+阅读 · 2023年2月17日

Deep Reinforcement Learning for Multi-Agent Interaction

Arxiv

44+阅读 · 2022年8月2日

A Survey on Deep Reinforcement Learning for Data Processing and Analytics

Arxiv

24+阅读 · 2022年2月4日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions

Arxiv

14+阅读 · 2021年9月8日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

微信扫码咨询专知VIP会员