【微软亚研130PPT教程】强化学习简介 - 专知

会员服务 ·

0

【微软亚研130PPT教程】强化学习简介

2018 年 10 月 26 日 专知

【导读】近年来，强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功，成为人工智能研究的热点。微软亚洲研究院的秦涛研究员在报告《强化学习简介》中对强化学习做一个简要介绍。

报告内容

该报告分为3个部分：

强化学习基础，包括:

马氏决策过程
Bellman方程
规划
最优控制
蒙特卡洛采样
TD算法

强化学习新算法，包括:

基于值函数的算法
基于策略函数的算法
基于两者的混合算法

强化学习所面临的挑战，如鲁棒性、样本效率等

讲者简介

秦涛博士，微软亚洲研究院资深研究员/经理，中国科学技术大学博士生导师。主要研究领域包括机器学习和人工智能（深度学习和强化学习的算法设计、理论分析及在实际问题中的应用），互联网搜索与计算广告，博弈论和多智能体系统，在国际会议和期刊上发表学术论文100余篇。曾任SIGIR、ACML、AAMAS领域主席，担任多个国际学术大会程序委员会成员，包括ICML、NIPS、KDD、IJCAI、AAAI、WSDM、EC、SIGIR、AAMAS、WINE，曾任多个国际学术研讨会联合主席。获得《北京青年》2017年度年度“工匠精神·青年榜样”奖。

请关注专知公众号（扫一扫最下面专知二维码，或者点击上方蓝色专知）

后台回复“MSRLT4” 就可以获取PDF下载链接~

附部分PPT：

参考链接：

http://www.cips-cl.org/static/CCL2018/downloads/tutorialsPPT/T4.pdf

-END-

专 · 知

人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群，获取专业知识教程视频资料和与专家交流咨询！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

请加专知小助手微信（扫一扫如下二维码添加），加入专知主题群（请备注主题类型：AI、NLP、CV、 KG等）交流~

AI 项目技术 & 商务合作：bd@zhuanzhi.ai, 或扫描上面二维码联系！

请关注专知公众号，获取人工智能的专业知识！

点击“阅读原文”，使用专知

登录查看更多

36

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【MLSS2020】最新《元学习》教程，牛津大学Yee Whye Teh教授，165页ppt

【MLSS2020】最新《元学习》教程，牛津大学Yee Whye Teh教授，165页ppt

专知会员服务

136+阅读 · 2020年7月8日

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

模型优化基础，Sayak Paul，67页ppt

模型优化基础，Sayak Paul，67页ppt

专知会员服务

76+阅读 · 2020年6月8日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

203+阅读 · 2020年5月22日

元学习与图神经网络逻辑推导，55页ppt

元学习与图神经网络逻辑推导，55页ppt

专知会员服务

129+阅读 · 2020年4月25日

【Facebook AI】低资源机器翻译，74页ppt

【Facebook AI】低资源机器翻译，74页ppt

专知会员服务

30+阅读 · 2020年4月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

【资源】强化学习实践教程

【资源】强化学习实践教程

专知

43+阅读 · 2019年9月11日

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

专知

19+阅读 · 2019年6月17日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知

52+阅读 · 2019年1月3日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

基于深度学习的文本生成【附217页PPT下载】

基于深度学习的文本生成【附217页PPT下载】

专知

35+阅读 · 2018年11月24日

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

专知

21+阅读 · 2018年11月20日

Pytorch作者Adam Paszke-53页Pytorch教程PPT

Pytorch作者Adam Paszke-53页Pytorch教程PPT

专知

34+阅读 · 2018年10月27日

机器学习数学基础【附PPT下载】

机器学习数学基础【附PPT下载】

专知

46+阅读 · 2018年9月17日

【伯克利大学ICML2018强化学习80页教程】【附下载】

【伯克利大学ICML2018强化学习80页教程】【附下载】

专知

10+阅读 · 2018年7月21日

ICML2018 模仿学习教程

ICML2018 模仿学习教程

专知

6+阅读 · 2018年7月14日

Deep Learning for Learning Graph Representations

Arxiv

35+阅读 · 2020年1月2日

Tutorial on NLP-Inspired Network Embedding

Tutorial on NLP-Inspired Network Embedding

Arxiv

7+阅读 · 2019年10月16日

Text Classification Algorithms: A Survey

Arxiv

15+阅读 · 2019年6月25日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Relational Deep Reinforcement Learning

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

机器人控制

微软亚洲研究院

深度强化学习

相关VIP内容

【MLSS2020】最新《元学习》教程，牛津大学Yee Whye Teh教授，165页ppt

【MLSS2020】最新《元学习》教程，牛津大学Yee Whye Teh教授，165页ppt

专知会员服务

136+阅读 · 2020年7月8日

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

模型优化基础，Sayak Paul，67页ppt

模型优化基础，Sayak Paul，67页ppt

专知会员服务

76+阅读 · 2020年6月8日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

203+阅读 · 2020年5月22日

元学习与图神经网络逻辑推导，55页ppt

元学习与图神经网络逻辑推导，55页ppt

专知会员服务

129+阅读 · 2020年4月25日

【Facebook AI】低资源机器翻译，74页ppt

【Facebook AI】低资源机器翻译，74页ppt

专知会员服务

30+阅读 · 2020年4月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《自适应训练辅助系统概念导论及其在空战指挥官加速培训中的应用》125页

《美陆军近战整合企业现代化计划（2025—2026）》最新报告

以色列-伊朗空战：短暂而激烈冲突的启示

《动态作战支援演习框架构建》80页

相关资讯

【资源】强化学习实践教程

【资源】强化学习实践教程

专知

43+阅读 · 2019年9月11日

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

专知

19+阅读 · 2019年6月17日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知

52+阅读 · 2019年1月3日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

基于深度学习的文本生成【附217页PPT下载】

基于深度学习的文本生成【附217页PPT下载】

专知

35+阅读 · 2018年11月24日

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

专知

21+阅读 · 2018年11月20日

Pytorch作者Adam Paszke-53页Pytorch教程PPT

Pytorch作者Adam Paszke-53页Pytorch教程PPT

专知

34+阅读 · 2018年10月27日

机器学习数学基础【附PPT下载】

机器学习数学基础【附PPT下载】

专知

46+阅读 · 2018年9月17日

【伯克利大学ICML2018强化学习80页教程】【附下载】

【伯克利大学ICML2018强化学习80页教程】【附下载】

专知

10+阅读 · 2018年7月21日

ICML2018 模仿学习教程

ICML2018 模仿学习教程

专知

6+阅读 · 2018年7月14日

相关论文

Deep Learning for Learning Graph Representations

Arxiv

35+阅读 · 2020年1月2日

Tutorial on NLP-Inspired Network Embedding

Tutorial on NLP-Inspired Network Embedding

Arxiv

7+阅读 · 2019年10月16日

Text Classification Algorithms: A Survey

Arxiv

15+阅读 · 2019年6月25日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Relational Deep Reinforcement Learning

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

大家都在搜

CMU博士论文

无人机集群

国防科技创新

软件无线电

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员