【ICML2020】强化学习中基于模型的方法，279页ppt - 专知VIP

会员服务 ·

9

强化学习 · 基于模型的强化学习 ·

2020 年 10 月 26 日

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Model-Based Methods in Reinforcement Learning 本教程对基于模型的强化学习(MBRL)领域进行了广泛的概述，特别强调了深度方法。MBRL方法利用环境模型来做决策——而不是将环境看作一个黑箱——并且提供了超越无模型RL的独特机会和挑战。我们将讨论学习过渡和奖励模式的方法，如何有效地使用这些模式来做出更好的决策，以及计划和学习之间的关系。我们还强调了在典型的RL设置之外利用世界模型的方式，以及在设计未来的MBRL系统时，从人类认知中可以得到什么启示。

成为VIP会员查看完整内容

47

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

专知会员服务

95+阅读 · 2020年10月18日

【ICML2020】基于贝叶斯元学习在关系图上进行小样本关系抽取

【ICML2020】基于贝叶斯元学习在关系图上进行小样本关系抽取

专知会员服务

38+阅读 · 2020年9月5日

【ICML2020Tutorial】机器学习信号处理，100页ppt

【ICML2020Tutorial】机器学习信号处理，100页ppt

专知会员服务

113+阅读 · 2020年8月15日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

专知会员服务

94+阅读 · 2020年7月16日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

专知会员服务

217+阅读 · 2020年2月15日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

19+阅读 · 2019年6月9日

TensorFlow 2.0深度强化学习指南

TensorFlow 2.0深度强化学习指南

云栖社区

18+阅读 · 2019年2月1日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

【干货】强化学习介绍

【干货】强化学习介绍

人工智能学家

13+阅读 · 2018年6月24日

强化学习——蒙特卡洛方法介绍

强化学习——蒙特卡洛方法介绍

论智

12+阅读 · 2018年6月3日

干货｜浅谈强化学习的方法及学习路线

干货｜浅谈强化学习的方法及学习路线

机器学习算法与Python学习

16+阅读 · 2018年3月28日

一文学习基于蒙特卡罗的强化学习方法（送书）

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测

【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测

专知

5+阅读 · 2017年10月23日

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

产业智能官

41+阅读 · 2017年8月18日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

Accommodating Picky Customers: Regret Bound and Exploration Complexity for Multi-Objective Reinforcement Learning

Arxiv

0+阅读 · 2020年11月25日

Heterogeneous Relational Reasoning in Knowledge Graphs with Reinforcement Learning

Heterogeneous Relational Reasoning in Knowledge Graphs with Reinforcement Learning

Arxiv

10+阅读 · 2020年3月12日

AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning

AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning

Arxiv

64+阅读 · 2020年2月28日

Multi-Temporal Aerial Image Registration Using Semantic Features

Multi-Temporal Aerial Image Registration Using Semantic Features

Arxiv

3+阅读 · 2019年9月19日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

KG^2: Learning to Reason Science Exam Questions with Contextual Knowledge Graph Embeddings

Arxiv

9+阅读 · 2018年5月31日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Training a Ranking Function for Open-Domain Question Answering

Arxiv

5+阅读 · 2018年4月12日

Learning Topic Models by Neighborhood Aggregation

Arxiv

3+阅读 · 2018年2月22日

VIP会员

相关主题

基于模型的强化学习

相关VIP内容

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

专知会员服务

95+阅读 · 2020年10月18日

【ICML2020】基于贝叶斯元学习在关系图上进行小样本关系抽取

【ICML2020】基于贝叶斯元学习在关系图上进行小样本关系抽取

专知会员服务

38+阅读 · 2020年9月5日

【ICML2020Tutorial】机器学习信号处理，100页ppt

【ICML2020Tutorial】机器学习信号处理，100页ppt

专知会员服务

113+阅读 · 2020年8月15日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

专知会员服务

94+阅读 · 2020年7月16日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

专知会员服务

217+阅读 · 2020年2月15日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

19+阅读 · 2019年6月9日

TensorFlow 2.0深度强化学习指南

TensorFlow 2.0深度强化学习指南

云栖社区

18+阅读 · 2019年2月1日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

【干货】强化学习介绍

【干货】强化学习介绍

人工智能学家

13+阅读 · 2018年6月24日

强化学习——蒙特卡洛方法介绍

强化学习——蒙特卡洛方法介绍

论智

12+阅读 · 2018年6月3日

干货｜浅谈强化学习的方法及学习路线

干货｜浅谈强化学习的方法及学习路线

机器学习算法与Python学习

16+阅读 · 2018年3月28日

一文学习基于蒙特卡罗的强化学习方法（送书）

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测

【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测

专知

5+阅读 · 2017年10月23日

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

产业智能官

41+阅读 · 2017年8月18日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

相关论文

Accommodating Picky Customers: Regret Bound and Exploration Complexity for Multi-Objective Reinforcement Learning

Arxiv

0+阅读 · 2020年11月25日

Heterogeneous Relational Reasoning in Knowledge Graphs with Reinforcement Learning

Heterogeneous Relational Reasoning in Knowledge Graphs with Reinforcement Learning

Arxiv

10+阅读 · 2020年3月12日

AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning

AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning

Arxiv

64+阅读 · 2020年2月28日

Multi-Temporal Aerial Image Registration Using Semantic Features

Multi-Temporal Aerial Image Registration Using Semantic Features

Arxiv

3+阅读 · 2019年9月19日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

KG^2: Learning to Reason Science Exam Questions with Contextual Knowledge Graph Embeddings

Arxiv

9+阅读 · 2018年5月31日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Training a Ranking Function for Open-Domain Question Answering

Arxiv

5+阅读 · 2018年4月12日

Learning Topic Models by Neighborhood Aggregation

Arxiv

3+阅读 · 2018年2月22日

微信扫码咨询专知VIP会员