**简介

通过理论理解深度强化学习(deep RL)中最流行的库,本新版专注于深度RL的最新进展,采用代码学习的方法,使读者能够理解并复现该领域的最新研究。

**深度强化学习的最新进展

本书介绍了从游戏、机器人到金融的新代理环境,帮助读者尝试将强化学习应用于不同领域。多智能体强化学习章节涵盖了多个智能体的竞争方式,另一章节则专注于广泛使用的深度RL算法——近端策略优化(Proximal Policy Optimization, PPO)。读者将了解如何通过大型语言模型(如ChatGPT)使用人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)来提升对话能力。

**实践与部署

本书还将介绍在多个云系统上使用代码和在Hugging Face Hub等平台上部署模型的步骤。代码采用Jupyter Notebook格式,可以在Google Colab等深度学习云平台上运行,允许读者根据自己的需求调整代码。无论是在游戏、机器人还是生成AI应用中,《Deep Reinforcement Learning with Python》都将帮助您保持技术前沿。

**学习内容

  • 探索基于Python的RL库,包括StableBaselines3和CleanRL
  • 使用多样化的RL环境,如Gymnasium、Pybullet和Unity ML
  • 理解使用RLHF和PPO进行大型语言模型的指令微调
  • 学习使用Hugging Face、Weights and Biases和Optuna的训练和优化技术

**适合人群

本书适合希望提升对深度RL理解并获取实际实现RL算法技能的软件工程师和机器学习开发者。通过本书,您将能够从头开始实现并优化RL算法,掌握前沿技术应用于实际项目。

成为VIP会员查看完整内容
60

相关内容

书籍在狭义上的理解是带有文字和图像的纸张的集合。广义的书则是一切传播信息的媒体。
【Manning新书】面向数据编程降低软件复杂度,426页pdf
专知会员服务
85+阅读 · 2022年9月5日
【干货书】深度学习数学:理解神经网络,347页pdf
专知会员服务
264+阅读 · 2022年7月3日
【新书】深度学习搜索,Deep Learning for Search,附327页pdf
专知会员服务
211+阅读 · 2020年1月13日
国家自然科学基金
14+阅读 · 2016年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
163+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
425+阅读 · 2023年3月31日
Arxiv
69+阅读 · 2023年3月26日
Arxiv
153+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【Manning新书】面向数据编程降低软件复杂度,426页pdf
专知会员服务
85+阅读 · 2022年9月5日
【干货书】深度学习数学:理解神经网络,347页pdf
专知会员服务
264+阅读 · 2022年7月3日
【新书】深度学习搜索,Deep Learning for Search,附327页pdf
专知会员服务
211+阅读 · 2020年1月13日
相关基金
国家自然科学基金
14+阅读 · 2016年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员