【Facebook】强化学习中的探索与利用，Matteo Pirotta讲解，137页ppt - 专知VIP

会员服务 ·

3

强化学习 · 强化学习探索 · 强化学习利用 ·

2021 年 4 月 8 日

【Facebook】强化学习中的探索与利用，Matteo Pirotta讲解，137页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习(RL)的一个主要挑战是在探索环境以收集信息和利用到目前为止观察到的样本来执行“好的”(近乎最佳的)行动之间进行权衡。在本研讨会中，我们将回顾在连续状态-动作空间中如何将探索技术与函数近似相结合。我们将特别关注探索机制与深度学习技术的整合。研讨会应提供足够的理论和算法背景，以了解现有的技术，并可能设计新的方法。在整个讲座中，我们将讨论开放性问题和未来可能的研究方向。

https://rl-vs.github.io/rlvs2021/exploration.html

成为VIP会员查看完整内容

39

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

基于深度强化学习的机器人运动控制研究进展

专知会员服务

65+阅读 · 2021年4月22日

【Facebook-Yuandong Tian】在RL中为搜索和探索找到良好的表示，附71页PPT与视频

专知会员服务

18+阅读 · 2021年4月16日

【DeepMind教程】蒙特卡罗树搜索，60页ppt

专知会员服务

59+阅读 · 2021年4月7日

【NeurIPS 2020】近似推断进展，272页ppt

【NeurIPS 2020】近似推断进展，272页ppt

专知会员服务

33+阅读 · 2020年12月11日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知会员服务

59+阅读 · 2020年12月9日

【Google】梯度下降，48页ppt

【Google】梯度下降，48页ppt

专知会员服务

81+阅读 · 2020年12月5日

Google最新《机器学习对偶性》报告，48页ppt

Google最新《机器学习对偶性》报告，48页ppt

专知会员服务

36+阅读 · 2020年11月29日

【康奈尔】最新《强化学习基础》CS 6789课程

【康奈尔】最新《强化学习基础》CS 6789课程

专知会员服务

69+阅读 · 2020年9月27日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

图神经网络推理，27页ppt精炼讲解

图神经网络推理，27页ppt精炼讲解

专知

3+阅读 · 2020年4月24日

AlphaGo之父David Silver最新演讲，传授强化学习的十大原则

AlphaGo之父David Silver最新演讲，传授强化学习的十大原则

深度学习世界

3+阅读 · 2018年9月21日

强化学习十大原则

强化学习十大原则

专知

12+阅读 · 2018年9月17日

【干货】强化学习介绍

【干货】强化学习介绍

专知

12+阅读 · 2018年6月24日

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

新智元

16+阅读 · 2018年2月5日

【NIPS2017】 DeepMind深度学习最佳实践与新技术展望，181页PPT全景展示最近深度学习技术（附下载）

【NIPS2017】 DeepMind深度学习最佳实践与新技术展望，181页PPT全景展示最近深度学习技术（附下载）

机器学习研究会

4+阅读 · 2017年12月14日

【AlphaGo Zero 核心技术-深度强化学习教程笔记09】探索与利用

【AlphaGo Zero 核心技术-深度强化学习教程笔记09】探索与利用

专知

4+阅读 · 2017年10月28日

【DeepMind 公开课-深度强化学习教程代码实战01】迭代法评估4*4方格世界下的随机策略

【DeepMind 公开课-深度强化学习教程代码实战01】迭代法评估4*4方格世界下的随机策略

专知

6+阅读 · 2017年10月23日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

VidFace: A Full-Transformer Solver for Video FaceHallucination with Unaligned Tiny Snapshots

VidFace: A Full-Transformer Solver for Video FaceHallucination with Unaligned Tiny Snapshots

Arxiv

0+阅读 · 2021年5月31日

Electryo, In-person Voting with Transparent Voter Verifiability and Eligibility Verifiability

Arxiv

0+阅读 · 2021年5月31日

1$\times$N Block Pattern for Network Sparsity

Arxiv

0+阅读 · 2021年5月31日

Analysis of high-dimensional Continuous Time Markov Chains using the Local Bouncy Particle Sampler

Arxiv

0+阅读 · 2021年5月30日

Colorization Transformer

Arxiv

9+阅读 · 2021年2月8日

Path Planning using Neural A* Search

Arxiv

5+阅读 · 2021年2月8日

Deep Graph Infomax

Deep Graph Infomax

Arxiv

17+阅读 · 2018年12月21日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments

Arxiv

6+阅读 · 2018年1月16日

Mitigating the Impact of Speech Recognition Errors on Chatbot using Sequence-to-Sequence Model

Arxiv

4+阅读 · 2017年12月2日

VIP会员

相关主题

强化学习探索

强化学习利用

相关VIP内容

基于深度强化学习的机器人运动控制研究进展

专知会员服务

65+阅读 · 2021年4月22日

【Facebook-Yuandong Tian】在RL中为搜索和探索找到良好的表示，附71页PPT与视频

专知会员服务

18+阅读 · 2021年4月16日

【DeepMind教程】蒙特卡罗树搜索，60页ppt

专知会员服务

59+阅读 · 2021年4月7日

【NeurIPS 2020】近似推断进展，272页ppt

【NeurIPS 2020】近似推断进展，272页ppt

专知会员服务

33+阅读 · 2020年12月11日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知会员服务

59+阅读 · 2020年12月9日

【Google】梯度下降，48页ppt

【Google】梯度下降，48页ppt

专知会员服务

81+阅读 · 2020年12月5日

Google最新《机器学习对偶性》报告，48页ppt

Google最新《机器学习对偶性》报告，48页ppt

专知会员服务

36+阅读 · 2020年11月29日

【康奈尔】最新《强化学习基础》CS 6789课程

【康奈尔】最新《强化学习基础》CS 6789课程

专知会员服务

69+阅读 · 2020年9月27日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

图神经网络推理，27页ppt精炼讲解

图神经网络推理，27页ppt精炼讲解

专知

3+阅读 · 2020年4月24日

AlphaGo之父David Silver最新演讲，传授强化学习的十大原则

AlphaGo之父David Silver最新演讲，传授强化学习的十大原则

深度学习世界

3+阅读 · 2018年9月21日

强化学习十大原则

强化学习十大原则

专知

12+阅读 · 2018年9月17日

【干货】强化学习介绍

【干货】强化学习介绍

专知

12+阅读 · 2018年6月24日

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

新智元

16+阅读 · 2018年2月5日

【NIPS2017】 DeepMind深度学习最佳实践与新技术展望，181页PPT全景展示最近深度学习技术（附下载）

【NIPS2017】 DeepMind深度学习最佳实践与新技术展望，181页PPT全景展示最近深度学习技术（附下载）

机器学习研究会

4+阅读 · 2017年12月14日

【AlphaGo Zero 核心技术-深度强化学习教程笔记09】探索与利用

【AlphaGo Zero 核心技术-深度强化学习教程笔记09】探索与利用

专知

4+阅读 · 2017年10月28日

【DeepMind 公开课-深度强化学习教程代码实战01】迭代法评估4*4方格世界下的随机策略

【DeepMind 公开课-深度强化学习教程代码实战01】迭代法评估4*4方格世界下的随机策略

专知

6+阅读 · 2017年10月23日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

VidFace: A Full-Transformer Solver for Video FaceHallucination with Unaligned Tiny Snapshots

VidFace: A Full-Transformer Solver for Video FaceHallucination with Unaligned Tiny Snapshots

Arxiv

0+阅读 · 2021年5月31日

Electryo, In-person Voting with Transparent Voter Verifiability and Eligibility Verifiability

Arxiv

0+阅读 · 2021年5月31日

1$\times$N Block Pattern for Network Sparsity

Arxiv

0+阅读 · 2021年5月31日

Analysis of high-dimensional Continuous Time Markov Chains using the Local Bouncy Particle Sampler

Arxiv

0+阅读 · 2021年5月30日

Colorization Transformer

Arxiv

9+阅读 · 2021年2月8日

Path Planning using Neural A* Search

Arxiv

5+阅读 · 2021年2月8日

Deep Graph Infomax

Deep Graph Infomax

Arxiv

17+阅读 · 2018年12月21日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments

Arxiv

6+阅读 · 2018年1月16日

Mitigating the Impact of Speech Recognition Errors on Chatbot using Sequence-to-Sequence Model

Arxiv

4+阅读 · 2017年12月2日

微信扫码咨询专知VIP会员