福利 | DeepMind重磅推出进阶版深度学习与强化学习视频教程

2018 年 11 月 27 日 AI科技评论

DeepMind 重磅推出进阶版深度学习与强化学习视频教程

近日,DeepMind 与 UCL(University College London)联合推出进阶版深度学习与强化学习视频教程,该教程在 YouTube 可以完整观看,共有 18 课时。

在线观看地址(请使用科学上网进行观看):

https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs

【小编注:请注意每节课时平均长达 100 分钟,请合理使用科学上网时长】

该课程分为两大部分,第一部分是深度神经网络的机器学习,另一部分是利用强化学习进行预测和控制,在研究深度强化学习的过程中,这两个部分将串联在一起,深度神经网络在强化学习环境中被训练成函数逼近器。

图片:课程的主要安排

在本课程中,深度学习部分将简要地介绍神经网络与 TensorFlow 的监督学习,接着将会讲授卷积神经网络、循环神经网络、端到端与基于能量的学习、优化方法、无监督学习、注意力以及记忆。其中探讨的可能应用领域包含对象识别与自然语言处理。

而在强化学习部分,该课程将涵盖马尔科夫决策过程、动态规划、无模型预测和控制、值函数逼近、策略梯度方法、学习与规划的整合,以及探索与开发的困境。其中探讨的可能应用领域包含学习玩经典棋盘游戏与电子游戏。

课时列表及播放地址

深度学习 1:基于人工智能的机器学习简介

https://youtu.be/iOh7QUZGyiU

深度学习 2:TensorFlow 介绍

https://youtu.be/JO0LwmIlWw0

深度学习 3:神经网络基础

https://youtu.be/5eAXoPSBgnE

强化学习 1:强化学习介绍

https://youtu.be/ISk80iLhdfU

强化学习 2:探索与开发

https://youtu.be/eM6IBYVqXEA

强化学习 3:马尔可夫决策过程与动态规划

https://youtu.be/hMbxmRyDw5M

强化学习 4:无模型预测和控制

https://youtu.be/nnxHlg-2WgA

深度学习 4:超越图像识别、端到端学习、嵌入

https://youtu.be/OfKnA91zs9I

强化学习 5:函数逼近与深度强化学习

https://youtu.be/wAk1lxmiW4c

强化学习 6:策略梯度与 Actor Critics 算法

https://youtu.be/bRfUxQs6xIM

深度学习 5:机器学习的优化

https://youtu.be/ALdsqfrLieg

强化学习 7:规划与模型

https://youtu.be/Xrxrd8nl4YI

深度学习 6:基于自然语言处理(NLP)的深度学习

https://youtu.be/Y95JwaynE40

强化学习 8:深度增强学习的进阶主题学习

https://youtu.be/L6xaQ501jEs

深度学习 7:深度学习中的注意力和记忆

https://youtu.be/Q57rzaHHO0k

强化学习 9:深度强化学习智能体的简介

https://youtu.be/-mhBD8Frkc4

深度学习 8:无监督学习和生成模型

https://youtu.be/H4VGSYGvJiA

强化学习 10:经典游戏案例学习

https://youtu.be/ld28AU7DDB4

温馨提醒

由于本课程是进阶课程,需要有相应的知识储备方可继续学习,另外课程视频为全英文无字幕(也可以在 YouTube 播放时设置中选择开启自动生成的字幕,但是效果可能不是很好),播放时建议认真观看。

点击阅读原文,查看Machine Learning Mastery 实战机器学习 - 从入门到精通资源吧~

登录查看更多
0

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
201+阅读 · 2020年5月22日
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
【MIT深度学习课程】深度序列建模,Deep Sequence Modeling
专知会员服务
77+阅读 · 2020年2月3日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
An Analysis of Object Embeddings for Image Retrieval
Arxiv
4+阅读 · 2019年5月28日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Arxiv
4+阅读 · 2018年5月4日
VIP会员
相关VIP内容
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
201+阅读 · 2020年5月22日
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
【MIT深度学习课程】深度序列建模,Deep Sequence Modeling
专知会员服务
77+阅读 · 2020年2月3日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
Top
微信扫码咨询专知VIP会员