「深度理解强化学习」课程更新，完善资料免费学习新课！

2019 年 5 月 9 日 AI研习社

AI 研习社「深度理解强化学习」课程更新啦~

强化学习是一种重要的机器学习类型，我们训练的智能体通过执行操作和查看结果来了解如何在环境中执行操作。最广为人知的强化学习例子就是Alphago。2016年Alphago战胜围棋世界冠军李世石，震撼全人类，AI学术界和工业界也积极投入到强化学习的研究和探索中。

本期更新的内容为第三课「RL 环境介绍与搭建」。在本期课程中，授课讲师将会一步步教你如何搭建 Python 环境、强化学习环境和深度学习环境，帮助初学者上手强化学习。

现在 AI 研习社的用户可通过完善个人资料获取解锁卡，免费解锁观看本系列课程最新课时，具体操作如下：

进入课程页面，点击未解锁的课时

跳转至个人资料页完善资料

在解锁方式页面，点击「去完善」按钮，跳转至个人资料页。

完善个人资料至完善度 100%

将个人资料填写至完善度 100%，然后点击提交按钮，即可获得解锁卡一张。

彩蛋

完善个人资料后会立即获得 100 研值，您可以跳转至研习社福利市集兑换价值 100 元的课程优惠券。

扫描下方优惠券进行兑换：

https://ai.yanxishe.com/page/vouchersDetail/5cc50cf1e5794

完善个人资料会生成你的社区专有名片，有助于你结识更多社区内相同技术方向、研究兴趣的朋友。

后续 AI 研习社将会上线更多有趣有料的社交功能，帮助用户构建行业人脉。

授课讲师

王湛，上海交通大学硕士，研究方向为强化学习、计算机视觉等方向，在ACM MM Asia等国际会议上发表过相关论文。并对强化学习与计算机视觉的结合有很深的理解。

课程大纲

第一课简介

1.1 强化学习初步介绍

1.2 强化学习基本要素和概念

1.3 课程要求

第二课马尔科夫决策过程(MDP)

2.1 强化学习模型构建

2.2 马尔科夫奖赏过程

2.3 马尔科夫决策过程

第三课 RL环境介绍与搭建

3.1 Python环境

3.2 强化学习环境

3.3 深度学习环境搭建

第四课强化学习解法1

4.1 动态规划(DP)-值函数

4.2 动态规划(DP)-动作值函数

4.3 动态规划(DP)-总结

第五课强化学习解法2

5.1 蒙特卡洛学习(Monte-Carlo Prediction)

5.2 蒙特卡洛学习(Monte-Carlo Control)

5.3 蒙特卡洛学习(Coding exercise)

第六课强化学习解法3

6.1 时序差分学习(Temporal-Difference Learning)

6.2 Sarsa算法

6.3 总结

第七课强化学习解法4

7.1 时序差分学习之(Q-learning)

7.2 Q-learning(Coding exercise)

7.3 总结

第八课深度Q网络

8.1 值函数的近似

8.2 Deep Q network

8.3 Coding exercise

第九课策略梯度(Policy Gradient)

9.1 策略梯度思想

9.2 Reinforce算法

9.3 Coding exercise

第十课 Actor Critic

10.1 Actor Critic介绍

10.2 Deep Deterministic Policy Gradient (DDPG)

10.3 Asynchronous Advantage Actor-Critic (A3C)

10.4 RL新型算法的自我学习与提升

扫码加入强化学习课程群，和老师交流学习问题

点击

阅读原文

加入课程，新学员可以再得一张解锁卡哦！

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

《强化学习》简介小册，24页pdf

专知会员服务

276+阅读 · 2020年4月19日

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【KDD2019|讲座推荐】深强化学习及其在交通运输中的应用：Deep Reinforcement Learning with Applications in Transportation

专知会员服务

56+阅读 · 2019年12月4日

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

专知会员服务

121+阅读 · 2019年11月24日

【课程】Geoffrey Hinton《神经网络机器学习》经典课程，附课程PPT下载

专知会员服务

46+阅读 · 2019年11月4日

【麻省理工学院课程】MIT 6.S094: Deep Learning for Self-Driving Cars，深度学习和自动驾驶课程

专知会员服务

51+阅读 · 2019年11月1日

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

专知会员服务

65+阅读 · 2019年8月8日

B站学强化学习？港中文周博磊变身up主，中文课程已上线

机器之心

18+阅读 · 2020年3月18日

独家 | 强化学习必看！UC 伯克利 CS 285 双语字幕课程今日正式上线

AI科技评论

5+阅读 · 2019年12月23日

价值2980元的廖雪峰人工智能入门课程，终终终于免费了！！！

计算机视觉战队

13+阅读 · 2019年4月23日

伯克利《深度强化学习》更新 | 第四讲：强化学习简介

AI研习社

5+阅读 · 2019年3月22日

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

全网独家！2018 MIT 6.S094 中文译版「深度学习和自动驾驶课」

AI科技评论

7+阅读 · 2018年4月13日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

公开课 | 强化学习之基础入门

AI100

6+阅读 · 2018年1月7日

【干货】最新深度学习课程，国立台湾大学李宏毅-2017年（秋）（附视频观看下载）

专知

15+阅读 · 2017年11月9日

深度强化学习小白入门攻略篇

StuQ

5+阅读 · 2017年9月7日

Multi-Stage Document Ranking with BERT

Arxiv

5+阅读 · 2019年10月31日

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Logically-Constrained Reinforcement Learning

Arxiv

3+阅读 · 2018年12月6日

HAQ: Hardware-Aware Automated Quantization

Arxiv

6+阅读 · 2018年11月21日

Efficient Eligibility Traces for Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年10月23日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Variational Bayesian Reinforcement Learning with Regret Bounds

Arxiv

3+阅读 · 2018年7月25日

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Diff-DAC: Distributed Actor-Critic for Average Multitask Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年4月22日

Deep Reinforcement Learning for List-wise Recommendations

Arxiv

13+阅读 · 2018年1月5日

VIP会员

「深度理解强化学习」课程更新，完善资料免费学习新课！

相关内容

知识荟萃

更多