哥伦比亚大学Elias Bareinboim副教授ICML 2020教程《因果强化学习》!
因果推理提供了一套工具和原则,允许人们结合数据和环境的结构不变性来推理反事实性质的问题。如果现实不是这样,会发生什么呢? 即使想象中的现实没有数据可用。强化学习关心的是在交互和不确定的环境中有效地找到一个优化特定功能的策略(例如,奖励,后悔)。这两个学科是独立发展的,它们之间几乎没有相互作用。然而,在现实中,它们对同一个构建块的不同方面进行操作,这使得他们紧密相连。
在本教程中,我们将基于这一观察结果引入统一的处理方法,并将这两个学科置于相同的概念和理论框架下。我们表明,当这一联系完全建立时,就会出现许多自然的和普遍的学习问题,而这不能单独从任何一个学科中看到。特别地,我们将讨论广义策略学习(在线、非策略和做微积分学习的组合)、何时何地干预、反事实决策(自由意志、自主、人与人工智能协作)、策略通用性和因果模仿学习等等。这种新的理解导致了对什么是反事实学习的更广泛的观点,并暗示了因果关系和强化学习并行研究的巨大潜力。我们称这种新的研究为“因果强化学习”(简称CRL)。
地址:
https://crl.causalai.net/
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“CRL147” 可以获取《ICML2020-因果强化学习-CRL,147页ppt,哥伦比亚大学-Elias Bareinboim》专知下载链接索引