从入门到精通的深度强化学习免费课程。
在本课程中,你将实现的一些Agent:
本课程包含一系列文章和视频,在这些文章和视频中,你将掌握成为深度强化学习专家所需的技能和架构。
通过使用Tensorflow平台,你将进行一系列有意思的实战:Play Space invaders、Doom、Sonic the dgedog等等!
课程主页
https://simoninithomas.github.io/Deep_reinforcement_learning_Course/
课程配套代码地址
https://github.com/simoninithomas/Deep_reinforcement_learning_Course
文末附本课程配套视频地址。
课程内容介绍
第一课:什么是深度强化学习?
课程概述:
在深入学习深度强化学习算法之前,需要学习一些需要掌握的基本概念。
什么是深度强化学习及其过程?
为什么奖励(reward)是RL的核心理念?
强化学习的三种方法是什么?
第二课: Q -学习
课程概述:
本节我们将学习Q学习算法以及如何用Numpy实现它。
第三课:深度Q -学习
课程概述:
本节我们将学习Deep Q学习算法以及如何用Tensorflow实现它。
第三课+ :深度Q学习的改进
课程概述:
本节主要讲解Deep Q学习的最新改进(Dueling DQN、优先体验补偿(Prioritized Experience Replay)和固定Q目标(fixed q-targets))以及如何用Tensorflow实现它们。
第四课:策略梯度(Policy Gradient)
课程概述:
在本节中,你将学习策略梯度下降法以及如何使用Tensorflow实现它。
第五课:Advantage Actor Critic( A2C )和异步Advantage Actor Critic( A3C )
课程概述:
你将学习Actor Critic logic以及如何实现A2C Agent,该Agent与Tensorflow一起play Sonic the Hedgehog。
第六部分: A2C风格的近似策略梯度下降法
课程概述:
你会学习如何在Tensorflow中实现PPO算法。
课程视频下载地址
公众号“深度学习与NLP”中回复“tndl19”获取下载地址。
往期精品内容推荐
Jacob Eisenstein《自然语言处理》最新经典教材免费分享
工业级实战 - 一文教会你基于Docker在Kubernetes上部署深度学习模型
Geffery Hinton-数字代表模型从数据中抽取的知识、AI不会有寒冬
DeepLearning_NLP
深度学习与NLP
商务合作请联系微信号:lqfarmerlq