【ICML2020-Tutorial】因果强化学习-CRL,147页ppt,哥伦比亚大学-Elias Bareinboim

2020 年 7 月 16 日 专知


哥伦比亚大学Elias Bareinboim副教授ICML 2020教程《因果强化学习》!



因果推理提供了一套工具和原则,允许人们结合数据和环境的结构不变性来推理反事实性质的问题。如果现实不是这样,会发生什么呢? 即使想象中的现实没有数据可用。强化学习关心的是在交互和不确定的环境中有效地找到一个优化特定功能的策略(例如,奖励,后悔)。这两个学科是独立发展的,它们之间几乎没有相互作用。然而,在现实中,它们对同一个构建块的不同方面进行操作,这使得他们紧密相连。


在本教程中,我们将基于这一观察结果引入统一的处理方法,并将这两个学科置于相同的概念和理论框架下。我们表明,当这一联系完全建立时,就会出现许多自然的和普遍的学习问题,而这不能单独从任何一个学科中看到。特别地,我们将讨论广义策略学习(在线、非策略和做微积分学习的组合)、何时何地干预、反事实决策(自由意志、自主、人与人工智能协作)、策略通用性和因果模仿学习等等。这种新的理解导致了对什么是反事实学习的更广泛的观点,并暗示了因果关系和强化学习并行研究的巨大潜力。我们称这种新的研究为“因果强化学习”(简称CRL)。


地址:

https://crl.causalai.net/





专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“CRL147” 可以获取《ICML2020-因果强化学习-CRL,147页ppt,哥伦比亚大学-Elias Bareinboim》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“阅读原文”,了解使用专知,查看获取5000+AI主题知识资源
登录查看更多
13

相关内容

【ICML2020Tutorial】机器学习信号处理,100页ppt
专知会员服务
111+阅读 · 2020年8月15日
【DeepMind】强化学习教程,83页ppt
专知会员服务
151+阅读 · 2020年8月7日
(ICML 2020 Tutorial)贝叶斯深度学习与概率模型构建,134页ppt
【伯克利-Ke Li】学习优化,74页ppt,Learning to Optimize
专知会员服务
40+阅读 · 2020年7月23日
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
125+阅读 · 2020年7月20日
【ICML2020-Tutorial】无标签表示学习,222页ppt,DeepMind
专知会员服务
89+阅读 · 2020年7月14日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
177+阅读 · 2020年5月29日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
ICML2018 模仿学习教程
专知
6+阅读 · 2018年7月14日
Arxiv
24+阅读 · 2020年3月11日
Image Segmentation Using Deep Learning: A Survey
Arxiv
44+阅读 · 2020年1月15日
Arxiv
7+阅读 · 2019年5月31日
Arxiv
13+阅读 · 2019年1月26日
Arxiv
6+阅读 · 2018年11月29日
Arxiv
6+阅读 · 2018年1月11日
VIP会员
相关VIP内容
【ICML2020Tutorial】机器学习信号处理,100页ppt
专知会员服务
111+阅读 · 2020年8月15日
【DeepMind】强化学习教程,83页ppt
专知会员服务
151+阅读 · 2020年8月7日
(ICML 2020 Tutorial)贝叶斯深度学习与概率模型构建,134页ppt
【伯克利-Ke Li】学习优化,74页ppt,Learning to Optimize
专知会员服务
40+阅读 · 2020年7月23日
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
125+阅读 · 2020年7月20日
【ICML2020-Tutorial】无标签表示学习,222页ppt,DeepMind
专知会员服务
89+阅读 · 2020年7月14日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
177+阅读 · 2020年5月29日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
Top
微信扫码咨询专知VIP会员