从入门到大师,强化学习你只要看这些就够了~

2020 年 8 月 13 日 计算机视觉life

对大脑的工作领域,我们知之甚少,但是我们知道的是,大脑能够通过反复尝试来学习知识。当我们做了合适的选择时,大脑就会给我们奖励,但当我们做了错误的抉择时,大脑就会惩罚我们。如果我们可以利用强大的计算能力,在软件中对这个具体过程进行建模,这就是强化学习。


强化学习是机器学习中的一个领域,其最早可以追溯到巴甫洛夫的条件反射实验,它从动物行为研究和优化控制两个领域独立发展,最终经Bellman之手将其抽象为马尔可夫决策过程 (Markov Decision Process,MDP)。


DeepMind DQN


强化学习的经典应用案例有:非线性二级摆系统(非线性控制问题)、棋类游戏、机器人学习站立和走路、无人驾驶、机器翻译、人机对话 等。


不过,强化学习比较快的入门方法是交互式的:

  1. 先阅读基础知识,掌握强化学习的发展脉络和整体框架概念;

  2. 尝试运行与实现基础算法,上手写代码,做出视觉demo;

  3. 然后再进一步系统地学习强化学习,包含基础理论及解法等。

那么,如何才能入门强化学习?如何掌握其框架和算法理论?别急,今天,给大家推荐一份由 开课吧 提供赞助,《强化学习资料包——从入门到进阶》。包含了 入门篇 和 进阶篇 两大部分内容。非常适合想深耕强化学习(RL)的同学。本号主为大家争取到了免费名额(前200还可以获得8份独家人工智能知识图谱哦)

目前,2000+ 看过这个资料的同学都顺利成为各公司算法工程师。长按识别下方二维码,快来领取资料吧!


扫码添加,免费获取超全资料

备注【强化学习】领取


划重点

01

强化学习(RL)——入门篇


资料一:RL经典入门教材(PPT版)

浅显易懂,通过此PPT的学习,可以使学员了解掌握强化学习的全貌,并且对强化学习的基本术语与原理有一定的了解。

资料二:必学算法与源码实现

强化学习的三大算法,掌握DDPG算法、TRPO算法、DPGA算法的实战能力,分别附伪代码和源代码实现。

TRPO算法实现

学习收获:

  • 掌握强化学习的基本算法

  • 对强化学习的核心概念有了一定的了解

  • 可以实现基础的强化学习算法


划重点

02

强化学习(RL)——进阶篇


资料三:《Reinforcement Learning : An introduction》书籍

本书的作者是Sutton,作为强化学习教父这本书是业内公认的的强化学习基础理论的经典著作是强化学习的必备书籍,入门小白夯实基础,豆瓣评分9.9分。


从强化学习基本思想出发,配合大量实例,帮助读者精确理解理论,提升思维层次。本书可以让你熟知强化学习的理论、策略、项目。


另附赠三本书籍:

第一本:Multi-Agent Machine Learning: a Reinforcement Approach,(英文版),中文名:《多智能体机器学习:强化学习方法》

主要内容:呈现多智能体机器学习中的不同算法和方法框架,讨论强化学习方法。


第二本:Reinforcement learning:state-of-the-art,(英文版),中文名:《强化学习》


主要内容:包含了强化学习领域中,当代主要的17个子领域的研究内容,包括:部分可观察环境、分层任务分解、关系知识表示和预测状态表示,此外,研究了强化学习中的迁移、进化方法和连续空间等问题。


第三本:Hands-on Reinforcement Learning with Python:master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and Tensorflow,(英文版),中文名:《python强化学习实战:应用OpenAI Gym和Tensorflow,精通强化学习和深度强化学习》


主要内容:从openai和tensorflow入门强化学习,马尔可夫决策过程和动态规划、蒙特卡罗方法、时间差分、MAB、深度学习、DQN、DRQN、A3C、策略梯度、ZX。


资料四:Python代码及Github项目


本资料为《Reinforcement Learning : An introduction》书籍对应章节代码,以及reinforcement-learning-an-introduction-master项目,让大家在系统学习强化理论与策略的同时,可以进行项目实战,提升自己的理论实践能力。


资料五:四份精品论文

论文一:讲述机器用强化学习实现连续任务的完成

《Benchmarking Reinforcement Learning Algorithms on Real-World Robots》


论文二:scalable  vision-based RL 在high-fidelity的imitation实现   

《QT-Opt: Scalable Deep Reinforcement Learning for Vision-Based Robotic Manipulation》


论文三:如何利用强化学习解决高保真的模仿任务

《ONE-SHOT HIGH-FIDELITY IMITATION:TRAINING LARGE-SCALE DEEP NETS WITH RL》


论文四:DPGA算法

《Deterministic Policy Gradient Algorithms》


学习收获:

  • 掌握强化学习核心理论

  • 能够独立复现强化学习必备算法

  • 能完成强化学习项目实战

这套全阶段强化学习资料,现在免费送给大家学习,本号目前 限时免费领取,想要从事强化学习深入研究、提升自己、冲击高薪的小伙伴抓紧时间,速速领取。


《强化学习资料包》

——从入门到进阶

长按扫码添加

获取完整版本免费资料

👇👇👇

备注【强化学习】添加👆


如果想要继续了解强化学习,还可以参加8月17日的为期三天的《强化学习实战训练营》,想要了解训练营的,可以添加上面的二维码咨询哦~

登录查看更多
1

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
66+阅读 · 2020年9月27日
【DeepMind】强化学习教程,83页ppt
专知会员服务
148+阅读 · 2020年8月7日
《强化学习》简介小册,24页pdf
专知会员服务
263+阅读 · 2020年4月19日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
114+阅读 · 2020年1月15日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
强化学习精品书籍
平均机器
24+阅读 · 2019年1月2日
一文了解强化学习
AI100
15+阅读 · 2018年8月20日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
26+阅读 · 2018年8月17日
强化学习的入门之旅
机器学习研究会
6+阅读 · 2018年2月12日
关于强化学习(附代码,练习和解答)
深度学习
35+阅读 · 2018年1月30日
公开课 | 强化学习之基础入门
AI100
6+阅读 · 2018年1月7日
数学不好能搞人工智能吗?
算法与数学之美
3+阅读 · 2017年11月27日
搞人工智能必备“数学库”
机器学习算法与Python学习
5+阅读 · 2017年11月20日
深度强化学习小白入门攻略篇
StuQ
5+阅读 · 2017年9月7日
Arxiv
21+阅读 · 2019年3月25日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
VIP会员
相关VIP内容
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
66+阅读 · 2020年9月27日
【DeepMind】强化学习教程,83页ppt
专知会员服务
148+阅读 · 2020年8月7日
《强化学习》简介小册,24页pdf
专知会员服务
263+阅读 · 2020年4月19日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
114+阅读 · 2020年1月15日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
相关资讯
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
强化学习精品书籍
平均机器
24+阅读 · 2019年1月2日
一文了解强化学习
AI100
15+阅读 · 2018年8月20日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
26+阅读 · 2018年8月17日
强化学习的入门之旅
机器学习研究会
6+阅读 · 2018年2月12日
关于强化学习(附代码,练习和解答)
深度学习
35+阅读 · 2018年1月30日
公开课 | 强化学习之基础入门
AI100
6+阅读 · 2018年1月7日
数学不好能搞人工智能吗?
算法与数学之美
3+阅读 · 2017年11月27日
搞人工智能必备“数学库”
机器学习算法与Python学习
5+阅读 · 2017年11月20日
深度强化学习小白入门攻略篇
StuQ
5+阅读 · 2017年9月7日
Top
微信扫码咨询专知VIP会员