理解强化学习(RL)智能体的新出现行为可能是困难的,因为此类智能体通常在复杂环境中使用高度复杂的决策程序进行训练。这导致了强化学习中各种可解释性方法的产生,这些方法旨在协调智能体的行为和观察者预期的行为之间可能出现的差异。最近的大多数方法都依赖于领域知识(这可能并不总是可用的),依赖于对智能体策略的分析,或者依赖于对底层环境的特定元素的分析(通常建模为马尔可夫决策过程(Markov Decision Process, MDP))。我们的关键主张是,即使底层的MDP不是完全已知的(例如,转移概率没有被准确地学习)或不是由智能体维护的(即,转移概率不是由智能体维护的)。,当使用无模型方法时),它仍然可以被利用来自动生成解释。出于这个目的,我们建议使用正式的MDP抽象和转换(以前在文献中用于加速搜索最优策略)来自动生成解释。由于这种转换通常基于环境的符号表示,它们可以表示预期和实际智能体行为之间差距的有意义的解释。我们正式地定义了这个问题,提出了一类可以用来解释突发行为的变换,并提出了能够有效地寻找解释的方法。我们将在一组标准基准上演示该方法。

成为VIP会员查看完整内容
37

相关内容

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法
【NeurIPS2021】视觉语言导航的课程学习
专知会员服务
24+阅读 · 2021年11月26日
【NeurIPS2021】对比主动推理
专知会员服务
30+阅读 · 2021年10月21日
专知会员服务
15+阅读 · 2021年10月16日
专知会员服务
14+阅读 · 2021年10月13日
专知会员服务
23+阅读 · 2021年10月6日
专知会员服务
25+阅读 · 2021年6月15日
【NeurIPS2020】点针图网络,Pointer Graph Networks
专知会员服务
40+阅读 · 2020年9月27日
可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
130+阅读 · 2020年5月14日
【NeurIPS2022】扩散视觉反事实解释
专知
0+阅读 · 2022年10月24日
【NeurIPS2022】基于最大熵编码的自监督学习
【NeurIPS2022】分布式自适应元强化学习
专知
3+阅读 · 2022年10月8日
【NeurIPS2021】视觉语言导航的课程学习
专知
1+阅读 · 2021年11月26日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年11月5日
Arxiv
0+阅读 · 2022年11月4日
Arxiv
19+阅读 · 2021年1月14日
已删除
Arxiv
32+阅读 · 2020年3月23日
VIP会员
相关VIP内容
【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法
【NeurIPS2021】视觉语言导航的课程学习
专知会员服务
24+阅读 · 2021年11月26日
【NeurIPS2021】对比主动推理
专知会员服务
30+阅读 · 2021年10月21日
专知会员服务
15+阅读 · 2021年10月16日
专知会员服务
14+阅读 · 2021年10月13日
专知会员服务
23+阅读 · 2021年10月6日
专知会员服务
25+阅读 · 2021年6月15日
【NeurIPS2020】点针图网络,Pointer Graph Networks
专知会员服务
40+阅读 · 2020年9月27日
可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
130+阅读 · 2020年5月14日
相关基金
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员