《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲 - 专知

会员服务 ·

0

《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲

2021 年 1 月 2 日 专知

https://deepmind.com/learning-resources/-introduction-reinforcement-learning-david-silver

这个经典的10部分课程，由强化学习(RL)的驱David Silver教授，虽然录制于2015年，但仍然是任何想要学习RL基础的同学所必需的资源。

强化学习已经成为现代机器学习中一项强大的技术，它允许系统通过反复试验进行学习。它已成功应用于许多领域，包括AlphaZero等系统，学会了掌握国际象棋、围棋和Shogi游戏。

这门课程由DeepMind首席科学家、伦敦大学学院教授、AlphaZero的共同创始人David Silver教授共同向学生们介绍RL中使用的主要方法和技术。学生们还会发现萨顿和巴托的经典著作《强化学习:入门》(Reinforcement Learning: an Introduction)是一个很有帮助的书籍。

经典书《强化学习导论》

强化学习教父 Richard Sutton 的经典教材《Reinforcement Learning：An Introduction》第二版公布啦。本书分为三大部分，共十七章，机器之心对其简介和框架做了扼要介绍，并附上了全书目录、课程代码与资料。下载《强化学习》PDF 请点击文末「阅读原文」。

原书籍地址：http://incompleteideas.net/sutton/book/bookdraft2017nov5.pdf
课程代码地址：https://github.com/ShangtongZhang/reinforcement-learning-an-introduction
课程资料地址：http://incompleteideas.net/sutton/book/the-book-2nd.html

当我们思考学习的本质时，首先映入脑海的想法很可能是通过与环境的交互进行学习。当一个婴儿玩耍时，挥舞手臂，左顾右盼，旁边没有老师指导他，他与环境却有着一种直接的感知连接。通过这种连接，他懂得了因果关系，行动带来的结果，以及为了达成目标所需做的一切。人的一生中，这样的交互成了我们关于环境和自身知识的主要来源。不管学习驾驶汽车，还是进行一场交谈，实际上我们自始至终观察着环境如何回应我们的所为，并通过自身行为影响当下情景。交互式学习几乎是所有学习与智能理论的基石。

本书中我们提出了一种通过计算实现交互式学习的方法。我们没有直接理论化人类或动物的学习方式，而是探索理想的学习环境，评估不同学习方法的有效性。即，我们站在人工智能研究者或工程师的角度来解决问题。我们探讨了在解决科学或经济问题方面表现突出的机器的设计，通过数学分析或计算实验评估其设计。我们提出的这一方法称之为强化学习。相较于其他机器学习方法，它更专注于交互之中的目标导向性学习。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“强化学习课程” 可以获取《《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

David Silver

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

专知会员服务

67+阅读 · 2021年3月24日

《深度强化学习》教程62页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

《深度强化学习》教程62页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

专知会员服务

47+阅读 · 2021年3月8日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

76+阅读 · 2021年1月23日

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

专知会员服务

66+阅读 · 2021年1月5日

【RLChina2020公开课】Lecture-11.pdf【多智能体学习与游戏AI前沿】

【RLChina2020公开课】Lecture-11.pdf【多智能体学习与游戏AI前沿】

专知会员服务

27+阅读 · 2020年8月6日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

【课程】概率图模型，卡内基梅隆大学邢波

【课程】概率图模型，卡内基梅隆大学邢波

专知会员服务

70+阅读 · 2019年11月4日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

B站学强化学习？港中文周博磊变身up主，中文课程已上线

B站学强化学习？港中文周博磊变身up主，中文课程已上线

机器之心

18+阅读 · 2020年3月18日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

120+阅读 · 2020年1月29日

强化学习从入门到放弃：汪军李宏毅等大佬资源大放送！

强化学习从入门到放弃：汪军李宏毅等大佬资源大放送！

新智元

23+阅读 · 2018年12月29日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

548页MIT强化学习教程，收藏备用【PDF下载】

548页MIT强化学习教程，收藏备用【PDF下载】

机器学习算法与Python学习

17+阅读 · 2018年10月11日

AlphaGo之父David Silver最新演讲，传授强化学习的十大原则

AlphaGo之父David Silver最新演讲，传授强化学习的十大原则

深度学习世界

3+阅读 · 2018年9月21日

11节麻省理工学院的通用人工智能课程大放送

11节麻省理工学院的通用人工智能课程大放送

全球人工智能

8+阅读 · 2018年2月6日

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第4讲（上）

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第4讲（上）

大数据文摘

3+阅读 · 2017年11月19日

【教程】Google DeepMind David Silver《深度强化学习》公开课教程学习笔记完整版

【教程】Google DeepMind David Silver《深度强化学习》公开课教程学习笔记完整版

专知

9+阅读 · 2017年10月29日

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

专知

126+阅读 · 2017年10月19日

InferNet for Delayed Reinforcement Tasks: Addressing the Temporal Credit Assignment Problem

Arxiv

0+阅读 · 2021年5月2日

Lipschitz Lifelong Reinforcement Learning

Arxiv

4+阅读 · 2020年1月17日

Relation-aware Graph Attention Network for Visual Question Answering

Arxiv

4+阅读 · 2019年3月29日

Passage Re-ranking with BERT

Arxiv

4+阅读 · 2019年2月18日

Residual Policy Learning

Residual Policy Learning

Arxiv

4+阅读 · 2018年12月15日

Visual Semantic Navigation using Scene Priors

Arxiv

5+阅读 · 2018年10月15日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Two Stream 3D Semantic Scene Completion

Two Stream 3D Semantic Scene Completion

Arxiv

4+阅读 · 2018年7月16日

Relational Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年6月5日

VIP会员

相关主题

强化学习导论

相关VIP内容

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

专知会员服务

67+阅读 · 2021年3月24日

《深度强化学习》教程62页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

《深度强化学习》教程62页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

专知会员服务

47+阅读 · 2021年3月8日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

76+阅读 · 2021年1月23日

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

专知会员服务

66+阅读 · 2021年1月5日

【RLChina2020公开课】Lecture-11.pdf【多智能体学习与游戏AI前沿】

【RLChina2020公开课】Lecture-11.pdf【多智能体学习与游戏AI前沿】

专知会员服务

27+阅读 · 2020年8月6日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

【课程】概率图模型，卡内基梅隆大学邢波

【课程】概率图模型，卡内基梅隆大学邢波

专知会员服务

70+阅读 · 2019年11月4日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

B站学强化学习？港中文周博磊变身up主，中文课程已上线

B站学强化学习？港中文周博磊变身up主，中文课程已上线

机器之心

18+阅读 · 2020年3月18日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

120+阅读 · 2020年1月29日

强化学习从入门到放弃：汪军李宏毅等大佬资源大放送！

强化学习从入门到放弃：汪军李宏毅等大佬资源大放送！

新智元

23+阅读 · 2018年12月29日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

548页MIT强化学习教程，收藏备用【PDF下载】

548页MIT强化学习教程，收藏备用【PDF下载】

机器学习算法与Python学习

17+阅读 · 2018年10月11日

AlphaGo之父David Silver最新演讲，传授强化学习的十大原则

AlphaGo之父David Silver最新演讲，传授强化学习的十大原则

深度学习世界

3+阅读 · 2018年9月21日

11节麻省理工学院的通用人工智能课程大放送

11节麻省理工学院的通用人工智能课程大放送

全球人工智能

8+阅读 · 2018年2月6日

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第4讲（上）

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第4讲（上）

大数据文摘

3+阅读 · 2017年11月19日

【教程】Google DeepMind David Silver《深度强化学习》公开课教程学习笔记完整版

【教程】Google DeepMind David Silver《深度强化学习》公开课教程学习笔记完整版

专知

9+阅读 · 2017年10月29日

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

专知

126+阅读 · 2017年10月19日

相关论文

InferNet for Delayed Reinforcement Tasks: Addressing the Temporal Credit Assignment Problem

Arxiv

0+阅读 · 2021年5月2日

Lipschitz Lifelong Reinforcement Learning

Arxiv

4+阅读 · 2020年1月17日

Relation-aware Graph Attention Network for Visual Question Answering

Arxiv

4+阅读 · 2019年3月29日

Passage Re-ranking with BERT

Arxiv

4+阅读 · 2019年2月18日

Residual Policy Learning

Residual Policy Learning

Arxiv

4+阅读 · 2018年12月15日

Visual Semantic Navigation using Scene Priors

Arxiv

5+阅读 · 2018年10月15日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Two Stream 3D Semantic Scene Completion

Two Stream 3D Semantic Scene Completion

Arxiv

4+阅读 · 2018年7月16日

Relational Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年6月5日

大家都在搜

CMU博士论文

无人机集群

软件无线电

久别重逢话双塔

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员