【普林斯顿-Mengdi Wang】强化学习统计复杂度，35页ppt - 专知VIP

会员服务 ·

0

强化学习 · 普林斯顿大学 (Princeton University) ·

2020 年 11 月 15 日

【普林斯顿-Mengdi Wang】强化学习统计复杂度，35页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近年来，强化学习(RL)的经验研究取得了越来越多的成功。然而，关于学习能力的许多理论问题并没有得到很好的理解。例如，要学习一个好的策略，需要多少观察?马尔可夫决策过程(MDP)中函数近似在线学习的遗憾之处是什么?从未知行为策略生成的日志历史记录中，我们如何最优地估计新策略的价值?在本次演讲中，我将回顾一些最近研究这些问题的成果，如从生成模型求解MDP的最小轴最优样本复杂性，通过回归的最小轴最优非策略评估，以及使用非参数模型估计的在线RL的遗憾。

http://www.ipam.ucla.edu/abstract/?tid=16408&pcode=LCO2020

成为VIP会员查看完整内容

21

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

强化学习算法与应用综述(中文版)， 13页pdf

专知会员服务

118+阅读 · 2020年12月17日

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

专知会员服务

41+阅读 · 2020年12月6日

【普林斯顿】机器学习数学视角，63页ppt

【普林斯顿】机器学习数学视角，63页ppt

专知会员服务

88+阅读 · 2020年11月6日

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

专知会员服务

48+阅读 · 2020年8月8日

【经典书】概率统计导论第五版，730页pdf

【经典书】概率统计导论第五版，730页pdf

专知会员服务

247+阅读 · 2020年7月28日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

解耦强化学习的值函数学习

解耦强化学习的值函数学习

CreateAMind

6+阅读 · 2019年9月5日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

【干货】强化学习介绍

【干货】强化学习介绍

专知

12+阅读 · 2018年6月24日

强化学习——蒙特卡洛方法介绍

强化学习——蒙特卡洛方法介绍

论智

12+阅读 · 2018年6月3日

增强学习算法讲解:马尔可夫决策过程MDP

增强学习算法讲解:马尔可夫决策过程MDP

数据挖掘入门与实战

7+阅读 · 2018年4月22日

强化学习初探 - 从多臂老虎机问题说起

强化学习初探 - 从多臂老虎机问题说起

专知

10+阅读 · 2018年4月3日

一文学习基于蒙特卡罗的强化学习方法（送书）

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

【干货】DeepMind 研究科学家深度生成模型报告，视频+PPT一文全揽最新前沿进展（附下载）

【干货】DeepMind 研究科学家深度生成模型报告，视频+PPT一文全揽最新前沿进展（附下载）

专知

8+阅读 · 2017年12月27日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

Quantum exploration algorithms for multi-armed bandits

Arxiv

0+阅读 · 2020年12月15日

Continuous-time Markov-switching GARCH Process with Robust and Efficient State Path and Volatility Estimation

Continuous-time Markov-switching GARCH Process with Robust and Efficient State Path and Volatility Estimation

Arxiv

0+阅读 · 2020年12月12日

Kernel Distributionally Robust Optimization

Arxiv

0+阅读 · 2020年12月12日

Online Sparse Reinforcement Learning

Online Sparse Reinforcement Learning

Arxiv

0+阅读 · 2020年12月12日

Efficient Eligibility Traces for Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年10月23日

Mean Field Multi-Agent Reinforcement Learning

Arxiv

5+阅读 · 2018年6月12日

Visual Tracking via Dynamic Graph Learning

Arxiv

5+阅读 · 2018年4月30日

Accelerated Reinforcement Learning

Arxiv

6+阅读 · 2018年4月24日

Cellular-Connected UAVs over 5G: Deep Reinforcement Learning for Interference Management

Arxiv

4+阅读 · 2018年1月16日

Being Robust (in High Dimensions) Can Be Practical

Arxiv

3+阅读 · 2017年12月14日

VIP会员

相关主题

普林斯顿大学 (Princeton University)

相关VIP内容

强化学习算法与应用综述(中文版)， 13页pdf

专知会员服务

118+阅读 · 2020年12月17日

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

专知会员服务

41+阅读 · 2020年12月6日

【普林斯顿】机器学习数学视角，63页ppt

【普林斯顿】机器学习数学视角，63页ppt

专知会员服务

88+阅读 · 2020年11月6日

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

专知会员服务

48+阅读 · 2020年8月8日

【经典书】概率统计导论第五版，730页pdf

【经典书】概率统计导论第五版，730页pdf

专知会员服务

247+阅读 · 2020年7月28日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

GPT-5如何对齐？从硬性拒绝到安全完成：走向以输出为中心的安全训练

【伯克利博士论文】超越人类监督的视觉智能

【ICCV2025】SO(3) 上连续非保守动力系统的预测

2025年中国数据要素行业发展研究报告

相关资讯

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

解耦强化学习的值函数学习

解耦强化学习的值函数学习

CreateAMind

6+阅读 · 2019年9月5日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

【干货】强化学习介绍

【干货】强化学习介绍

专知

12+阅读 · 2018年6月24日

强化学习——蒙特卡洛方法介绍

强化学习——蒙特卡洛方法介绍

论智

12+阅读 · 2018年6月3日

增强学习算法讲解:马尔可夫决策过程MDP

增强学习算法讲解:马尔可夫决策过程MDP

数据挖掘入门与实战

7+阅读 · 2018年4月22日

强化学习初探 - 从多臂老虎机问题说起

强化学习初探 - 从多臂老虎机问题说起

专知

10+阅读 · 2018年4月3日

一文学习基于蒙特卡罗的强化学习方法（送书）

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

【干货】DeepMind 研究科学家深度生成模型报告，视频+PPT一文全揽最新前沿进展（附下载）

【干货】DeepMind 研究科学家深度生成模型报告，视频+PPT一文全揽最新前沿进展（附下载）

专知

8+阅读 · 2017年12月27日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

相关论文

Quantum exploration algorithms for multi-armed bandits

Arxiv

0+阅读 · 2020年12月15日

Continuous-time Markov-switching GARCH Process with Robust and Efficient State Path and Volatility Estimation

Continuous-time Markov-switching GARCH Process with Robust and Efficient State Path and Volatility Estimation

Arxiv

0+阅读 · 2020年12月12日

Kernel Distributionally Robust Optimization

Arxiv

0+阅读 · 2020年12月12日

Online Sparse Reinforcement Learning

Online Sparse Reinforcement Learning

Arxiv

0+阅读 · 2020年12月12日

Efficient Eligibility Traces for Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年10月23日

Mean Field Multi-Agent Reinforcement Learning

Arxiv

5+阅读 · 2018年6月12日

Visual Tracking via Dynamic Graph Learning

Arxiv

5+阅读 · 2018年4月30日

Accelerated Reinforcement Learning

Arxiv

6+阅读 · 2018年4月24日

Cellular-Connected UAVs over 5G: Deep Reinforcement Learning for Interference Management

Arxiv

4+阅读 · 2018年1月16日

Being Robust (in High Dimensions) Can Be Practical

Arxiv

3+阅读 · 2017年12月14日

微信扫码咨询专知VIP会员