DeepMind推出深度学习与强化学习进阶课程(附视频)

2018 年 11 月 24 日 机器之心

机器之心报道

参与:张倩、李泽南


OpenAI 推出强化学习课程 Spinning Up 后不久。昨天,DeepMind 与 UCL 合作推出了一门深度学习与强化学习进阶课程,以在线视频形式呈现。该课程共有 18 节课,每节课都长达 1 小时 40 分钟,内容从深度学习框架 TensoFlow 的介绍到构建游戏智能体,可谓全面。


课程地址:https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs



该课程最初在伦敦大学学院(UCL)进行,为方便在线观看进行了录像。多位 DeepMind 的研究人员、UCL 教师参与了课程的设计。


参与课程制作的 DeepMind/UCL 团队


课程由两部分组成,一是包含深度神经网络的机器学习,二是利用强化学习进行预测和控制,两个部分相互穿插。在探讨深度学习的过程中,这两条线交汇在一起,其中的深度神经网络被训练为强化学习背景下的函数逼近器。


课程中的深度学习部分首先介绍了神经网络及使用 TensorFlow 的监督学习,接下来探讨了卷积神经网络、循环神经网络、端到端及基于能量的学习、优化方法、无监督学习、注意力及记忆。涉及的应用领域包括目标识别和自然语言处理。


第一课视频截图


深度强化学习部分介绍了马尔科夫决策过程、动态规划、无模型预测与控制、值函数近似、策略梯度方法、学习与规划整合、探索/利用困境等。涉及的应用领域包括学习玩经典棋盘游戏或电子游戏等。


第一课视频:




从第一课来看,本课程将讲解 DeepMind 的 AI 方法,深度强化学习在雅达利、AIphaGo 等游戏中的应用。


课程目录


深度学习 1:基于机器学习的人工智能简介


深度学习 2:TensorFlow 简介


深度学习 3:神经网络基础


强化学习 1:强化学习简介


强化学习 2:探索和利用


强化学习 3:马尔科夫决策过程及动态规划


强化学习 4:无模型预测与控制


深度学习 4:图像识别之外、端到端学习、嵌入


强化学习 5:函数逼近及深度强化学习


强化学习 6:策略梯度及 Actor Critic 算法


深度学习 5:用于机器学习的优化


强化学习 7:规划与模型


深度学习 6:用于自然语言处理的深度学习


强化学习 8:深度强化学习进阶主题


深度学习 7:深度学习中的注意力与记忆


强化学习 9:深度强化学习智能体概览


深度学习 8:无监督学习和生成模型


强化学习 10:经典游戏案例学习


课程门槛



然,这样一门进阶课程也是有一定门槛的。授课者提到,去年就有很多人抱怨课程负担太重。选这门课程的人需要懂 Python,还要有很多其他知识储备。另外,由于授课者都是活跃在学界的顶级研究者,课程会直接延伸到当前的研究前沿。


教师寄语:做好准备,迎接挑战!(brace yourselves!) 



今天有哪些论文值得一读?扫码开启订阅,每天15:00及时速递。


登录查看更多
0

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
197+阅读 · 2020年5月22日
【MIT深度学习课程】深度序列建模,Deep Sequence Modeling
专知会员服务
76+阅读 · 2020年2月3日
深度强化学习策略梯度教程,53页ppt
专知会员服务
177+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
114+阅读 · 2020年1月15日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
【干货】强化学习介绍
人工智能学家
13+阅读 · 2018年6月24日
Arxiv
6+阅读 · 2019年7月29日
Knowledge Flow: Improve Upon Your Teachers
Arxiv
5+阅读 · 2019年4月11日
Arxiv
8+阅读 · 2019年3月21日
Arxiv
15+阅读 · 2018年6月23日
Arxiv
6+阅读 · 2018年6月21日
Arxiv
5+阅读 · 2018年6月5日
VIP会员
相关VIP内容
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
197+阅读 · 2020年5月22日
【MIT深度学习课程】深度序列建模,Deep Sequence Modeling
专知会员服务
76+阅读 · 2020年2月3日
深度强化学习策略梯度教程,53页ppt
专知会员服务
177+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
114+阅读 · 2020年1月15日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
Top
微信扫码咨询专知VIP会员