【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt - 专知VIP

会员服务 ·

12

离线强化学习 · NeurIPS 2020 ·

2020 年 12 月 9 日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习(RL)为基于学习的控制提供了一种数学形式，允许通过优化用户指定的奖励函数来获得接近最优的行为。最近，由于在许多领域的出色应用，RL方法受到了相当多的关注，但事实上，RL需要一个基本的在线学习范式，这是其广泛采用的最大障碍之一。在线交互通常是不切实际的，因为数据收集是昂贵的(例如，在机器人或教育代理中)或危险的(例如，在自动驾驶或医疗保健中)。另一种方法是利用RL算法，在不需要在线交互的情况下有效地利用以前收集的经验。这被称为批处理RL、脱机RL或数据驱动RL。这样的算法对将数据集转化为强大的决策引擎有着巨大的希望，类似于数据集在视觉和NLP中被证明是成功的关键。在本教程中，我们的目标是为读者提供既可以利用离线RL作为工具，又可以在这个令人兴奋的领域进行研究的概念性工具。我们的目标是提供对离线RL的挑战的理解，特别是在现代深度RL方法的背景下，并描述一些潜在的解决方案。我们将以一种从业者易于理解的方式呈现经典和最新的方法，并讨论在这一领域开展研究的理论基础。我们将以讨论待解问题来结束。

https://sites.google.com/view/offlinerltutorial-neurips2020/home

成为VIP会员查看完整内容

59

相关内容

离线强化学习

离线强化学习

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

专知会员服务

117+阅读 · 2021年2月7日

不可错过！MILA最新《自监督表示学习》课程，附PPT与视频下载

不可错过！MILA最新《自监督表示学习》课程，附PPT与视频下载

专知会员服务

90+阅读 · 2020年12月21日

【NeurIPS 2020】近似推断进展，272页ppt

【NeurIPS 2020】近似推断进展，272页ppt

专知会员服务

33+阅读 · 2020年12月11日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知会员服务

109+阅读 · 2020年8月28日

【ICML2020Tutorial】机器学习信号处理，100页ppt

【ICML2020Tutorial】机器学习信号处理，100页ppt

专知会员服务

113+阅读 · 2020年8月15日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

专知会员服务

90+阅读 · 2020年7月14日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

【Texas 大学】强化学习领域的课程学习:一个框架和综述

【Texas 大学】强化学习领域的课程学习:一个框架和综述

专知会员服务

73+阅读 · 2020年3月22日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

专知

13+阅读 · 2020年7月16日

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

专知

30+阅读 · 2020年7月14日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知

26+阅读 · 2019年11月20日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

ICML2019《元学习》教程与必读论文列表

ICML2019《元学习》教程与必读论文列表

专知

42+阅读 · 2019年6月16日

ICML2018 模仿学习教程

ICML2018 模仿学习教程

专知

6+阅读 · 2018年7月14日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

Unsupervised Novel View Synthesis from a Single Image

Arxiv

0+阅读 · 2021年2月5日

Reinforcement Learning for Decision-Making and Control in Power Systems: Tutorial, Review, and Vision

Arxiv

0+阅读 · 2021年2月5日

A review of motion planning algorithms for intelligent robotics

Arxiv

0+阅读 · 2021年2月5日

Cache Blocking Technique to Large Scale Quantum Computing Simulation on Supercomputers

Arxiv

0+阅读 · 2021年2月5日

Reinforcement Learning Enhanced Quantum-inspired Algorithm for Combinatorial Optimization

Arxiv

4+阅读 · 2020年2月14日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Large-Scale Study of Curiosity-Driven Learning

Large-Scale Study of Curiosity-Driven Learning

Arxiv

8+阅读 · 2018年8月13日

Generative ScatterNet Hybrid Deep Learning (G-SHDL) Network with Structural Priors for Semantic Image Segmentation

Arxiv

7+阅读 · 2018年2月13日

VIP会员

相关主题

离线强化学习

相关VIP内容

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

专知会员服务

117+阅读 · 2021年2月7日

不可错过！MILA最新《自监督表示学习》课程，附PPT与视频下载

不可错过！MILA最新《自监督表示学习》课程，附PPT与视频下载

专知会员服务

90+阅读 · 2020年12月21日

【NeurIPS 2020】近似推断进展，272页ppt

【NeurIPS 2020】近似推断进展，272页ppt

专知会员服务

33+阅读 · 2020年12月11日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知会员服务

109+阅读 · 2020年8月28日

【ICML2020Tutorial】机器学习信号处理，100页ppt

【ICML2020Tutorial】机器学习信号处理，100页ppt

专知会员服务

113+阅读 · 2020年8月15日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

专知会员服务

90+阅读 · 2020年7月14日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

【Texas 大学】强化学习领域的课程学习:一个框架和综述

【Texas 大学】强化学习领域的课程学习:一个框架和综述

专知会员服务

73+阅读 · 2020年3月22日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

专知

13+阅读 · 2020年7月16日

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

专知

30+阅读 · 2020年7月14日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知

26+阅读 · 2019年11月20日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

ICML2019《元学习》教程与必读论文列表

ICML2019《元学习》教程与必读论文列表

专知

42+阅读 · 2019年6月16日

ICML2018 模仿学习教程

ICML2018 模仿学习教程

专知

6+阅读 · 2018年7月14日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

相关论文

Unsupervised Novel View Synthesis from a Single Image

Arxiv

0+阅读 · 2021年2月5日

Reinforcement Learning for Decision-Making and Control in Power Systems: Tutorial, Review, and Vision

Arxiv

0+阅读 · 2021年2月5日

A review of motion planning algorithms for intelligent robotics

Arxiv

0+阅读 · 2021年2月5日

Cache Blocking Technique to Large Scale Quantum Computing Simulation on Supercomputers

Arxiv

0+阅读 · 2021年2月5日

Reinforcement Learning Enhanced Quantum-inspired Algorithm for Combinatorial Optimization

Arxiv

4+阅读 · 2020年2月14日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Large-Scale Study of Curiosity-Driven Learning

Large-Scale Study of Curiosity-Driven Learning

Arxiv

8+阅读 · 2018年8月13日

Generative ScatterNet Hybrid Deep Learning (G-SHDL) Network with Structural Priors for Semantic Image Segmentation

Arxiv

7+阅读 · 2018年2月13日

微信扫码咨询专知VIP会员