【普林斯顿-Mengdi Wang】强化学习统计复杂度,35页ppt

2020 年 11 月 15 日 专知


近年来,强化学习(RL)的经验研究取得了越来越多的成功。然而,关于学习能力的许多理论问题并没有得到很好的理解。例如,要学习一个好的策略,需要多少观察?马尔可夫决策过程(MDP)中函数近似在线学习的遗憾之处是什么?从未知行为策略生成的日志历史记录中,我们如何最优地估计新策略的价值?在本次演讲中,我将回顾一些最近研究这些问题的成果,如从生成模型求解MDP的最小轴最优样本复杂性,通过回归的最小轴最优非策略评估,以及使用非参数模型估计的在线RL的遗憾。


http://www.ipam.ucla.edu/abstract/?tid=16408&pcode=LCO2020



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“RL35” 就可以获取【普林斯顿-Mengdi Wang】强化学习统计复杂度,35页ppt》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

Mengdi Wang,普林斯顿大学统计与机器学习中心的副教授。她还隶属于运筹学和金融工程系以及计算机科学系。她的研究重点是数据驱动的随机优化和在机器和强化学习中的应用。2013年,她获得了麻省理工学院电子工程和计算机科学博士学位。在麻省理工学院,Mengdi隶属于信息和决策系统实验室,并由Dimitri P. Bertsekas担任顾问。
【ICML2020】强化学习中基于模型的方法,279页ppt
专知会员服务
46+阅读 · 2020年10月26日
【CMU博士论文Wen Sun】强化学习的泛化性与效率,206页pdf
专知会员服务
91+阅读 · 2020年9月28日
【DeepMind】强化学习教程,83页ppt
专知会员服务
153+阅读 · 2020年8月7日
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
127+阅读 · 2020年7月20日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
图神经网络推理,27页ppt精炼讲解
专知
3+阅读 · 2020年4月24日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
Optimization for deep learning: theory and algorithms
Arxiv
104+阅读 · 2019年12月19日
Arxiv
18+阅读 · 2019年1月16日
A General and Adaptive Robust Loss Function
Arxiv
8+阅读 · 2018年11月5日
Viewpoint Estimation-Insights & Model
Arxiv
3+阅读 · 2018年7月3日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
5+阅读 · 2018年4月22日
Arxiv
6+阅读 · 2017年12月7日
VIP会员
相关VIP内容
【ICML2020】强化学习中基于模型的方法,279页ppt
专知会员服务
46+阅读 · 2020年10月26日
【CMU博士论文Wen Sun】强化学习的泛化性与效率,206页pdf
专知会员服务
91+阅读 · 2020年9月28日
【DeepMind】强化学习教程,83页ppt
专知会员服务
153+阅读 · 2020年8月7日
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
127+阅读 · 2020年7月20日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
相关论文
Optimization for deep learning: theory and algorithms
Arxiv
104+阅读 · 2019年12月19日
Arxiv
18+阅读 · 2019年1月16日
A General and Adaptive Robust Loss Function
Arxiv
8+阅读 · 2018年11月5日
Viewpoint Estimation-Insights & Model
Arxiv
3+阅读 · 2018年7月3日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
5+阅读 · 2018年4月22日
Arxiv
6+阅读 · 2017年12月7日
Top
微信扫码咨询专知VIP会员