【NeurIPS2022】通过模型转换的可解释强化学习 - 专知

会员服务 ·

0

【NeurIPS2022】通过模型转换的可解释强化学习

2022 年 10 月 4 日 专知

理解强化学习(RL)智能体的新出现行为可能是困难的，因为此类智能体通常在复杂环境中使用高度复杂的决策程序进行训练。这导致了强化学习中各种可解释性方法的产生，这些方法旨在协调智能体的行为和观察者预期的行为之间可能出现的差异。最近的大多数方法都依赖于领域知识(这可能并不总是可用的)，依赖于对智能体策略的分析，或者依赖于对底层环境的特定元素的分析(通常建模为马尔可夫决策过程(Markov Decision Process, MDP))。我们的关键主张是，即使底层的MDP不是完全已知的(例如，转移概率没有被准确地学习)或不是由智能体维护的(即，转移概率不是由智能体维护的)。，当使用无模型方法时)，它仍然可以被利用来自动生成解释。出于这个目的，我们建议使用正式的MDP抽象和转换(以前在文献中用于加速搜索最优策略)来自动生成解释。由于这种转换通常基于环境的符号表示，它们可以表示预期和实际智能体行为之间差距的有意义的解释。我们正式地定义了这个问题，提出了一类可以用来解释突发行为的变换，并提出了能够有效地寻找解释的方法。我们将在一组标准基准上演示该方法。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“TERL” 就可以获取《【NeurIPS2022】通过模型转换的可解释强化学习》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

1

相关内容

可解释强化学习

可解释强化学习

【CMU博士论文】强化学习可解释：统一状态和策略级解释，132页pdf

【CMU博士论文】强化学习可解释：统一状态和策略级解释，132页pdf

专知会员服务

40+阅读 · 2022年11月22日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知会员服务

88+阅读 · 2022年11月17日

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

专知会员服务

24+阅读 · 2022年11月8日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知会员服务

24+阅读 · 2022年10月8日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

105+阅读 · 2022年9月21日

【ICML2022】鲁棒强化学习的策略梯度法

【ICML2022】鲁棒强化学习的策略梯度法

专知会员服务

38+阅读 · 2022年5月21日

【NeurIPS2021】基于关联与识别的少样本目标检测

【NeurIPS2021】基于关联与识别的少样本目标检测

专知会员服务

24+阅读 · 2021年11月29日

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

专知会员服务

19+阅读 · 2021年11月22日

【NeurIPS2021】模型可解释性的符号语言基础

专知会员服务

22+阅读 · 2021年10月8日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

专知

2+阅读 · 2022年11月8日

【NeurIPS2022】时序解纠缠表示学习

【NeurIPS2022】时序解纠缠表示学习

专知

1+阅读 · 2022年10月30日

【NeurIPS2022】扩散视觉反事实解释

【NeurIPS2022】扩散视觉反事实解释

专知

0+阅读 · 2022年10月24日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知

3+阅读 · 2022年10月8日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

【NeurIPS2021】基于关联与识别的少样本目标检测

【NeurIPS2021】基于关联与识别的少样本目标检测

专知

0+阅读 · 2021年11月29日

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

专知

1+阅读 · 2021年11月22日

【NeurIPS2021】学习用于分布外预测的因果语义表示

【NeurIPS2021】学习用于分布外预测的因果语义表示

专知

1+阅读 · 2021年11月19日

【NeurIPS2021】存在潜在变量和选择偏差的递归因果结构学习

【NeurIPS2021】存在潜在变量和选择偏差的递归因果结构学习

专知

0+阅读 · 2021年11月15日

本体的解释诊断理论研究

国家自然科学基金

8+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

基于元模型的经验方式统一建模语言模型转换规则产生机制研究

国家自然科学基金

1+阅读 · 2012年12月31日

规则驱动的自适应多代理系统研究

国家自然科学基金

3+阅读 · 2012年12月31日

不确定多智能体系统一致性的分布式自适应控制

国家自然科学基金

7+阅读 · 2012年12月31日

高阶奇异群系统一致性分析与综合

国家自然科学基金

0+阅读 · 2011年12月31日

基于多Agent的通信交互式动态影响图研究及应用

国家自然科学基金

2+阅读 · 2009年12月31日

基于机器学习的软件度量分析

国家自然科学基金

1+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于抽象解释的逻辑程序验证研究

国家自然科学基金

1+阅读 · 2008年12月31日

Domain-Specific Bias Filtering for Single Labeled Domain Generalization

Arxiv

0+阅读 · 2022年11月22日

Towards Human-Interpretable Prototypes for Visual Assessment of Image Classification Models

Arxiv

0+阅读 · 2022年11月22日

Quasi-stable Coloring for Graph Compression: Approximating Max-Flow, Linear Programs, and Centrality

Arxiv

0+阅读 · 2022年11月21日

Are All Combinations Equal? Combining Textual and Visual Features with Multiple Space Learning for Text-Based Video Retrieval

Arxiv

0+阅读 · 2022年11月21日

A Generalized EigenGame with Extensions to Multiview Representation Learning

Arxiv

0+阅读 · 2022年11月21日

VarietySound: Timbre-Controllable Video to Sound Generation via Unsupervised Information Disentanglement

Arxiv

0+阅读 · 2022年11月19日

Adv-Attribute: Inconspicuous and Transferable Adversarial Attack on Face Recognition

Arxiv

0+阅读 · 2022年11月18日

Domain Generalization in Vision: A Survey

Arxiv

17+阅读 · 2021年7月18日

Does William Shakespeare REALLY Write Hamlet? Knowledge Representation Learning with Confidence

Arxiv

10+阅读 · 2018年2月16日

Graph Convolutional Networks for Named Entity Recognition

Arxiv

17+阅读 · 2018年2月14日

VIP会员

相关主题

可解释强化学习

相关VIP内容

【CMU博士论文】强化学习可解释：统一状态和策略级解释，132页pdf

【CMU博士论文】强化学习可解释：统一状态和策略级解释，132页pdf

专知会员服务

40+阅读 · 2022年11月22日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知会员服务

88+阅读 · 2022年11月17日

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

专知会员服务

24+阅读 · 2022年11月8日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知会员服务

24+阅读 · 2022年10月8日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

105+阅读 · 2022年9月21日

【ICML2022】鲁棒强化学习的策略梯度法

【ICML2022】鲁棒强化学习的策略梯度法

专知会员服务

38+阅读 · 2022年5月21日

【NeurIPS2021】基于关联与识别的少样本目标检测

【NeurIPS2021】基于关联与识别的少样本目标检测

专知会员服务

24+阅读 · 2021年11月29日

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

专知会员服务

19+阅读 · 2021年11月22日

【NeurIPS2021】模型可解释性的符号语言基础

专知会员服务

22+阅读 · 2021年10月8日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

《理解城市战及其在俄乌战争中的表现》报告

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

《建设式兵棋模拟作为战术集群配置优化的关键组成部分》

相关资讯

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

专知

2+阅读 · 2022年11月8日

【NeurIPS2022】时序解纠缠表示学习

【NeurIPS2022】时序解纠缠表示学习

专知

1+阅读 · 2022年10月30日

【NeurIPS2022】扩散视觉反事实解释

【NeurIPS2022】扩散视觉反事实解释

专知

0+阅读 · 2022年10月24日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知

3+阅读 · 2022年10月8日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

【NeurIPS2021】基于关联与识别的少样本目标检测

【NeurIPS2021】基于关联与识别的少样本目标检测

专知

0+阅读 · 2021年11月29日

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

专知

1+阅读 · 2021年11月22日

【NeurIPS2021】学习用于分布外预测的因果语义表示

【NeurIPS2021】学习用于分布外预测的因果语义表示

专知

1+阅读 · 2021年11月19日

【NeurIPS2021】存在潜在变量和选择偏差的递归因果结构学习

【NeurIPS2021】存在潜在变量和选择偏差的递归因果结构学习

专知

0+阅读 · 2021年11月15日

相关基金

本体的解释诊断理论研究

国家自然科学基金

8+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

基于元模型的经验方式统一建模语言模型转换规则产生机制研究

国家自然科学基金

1+阅读 · 2012年12月31日

规则驱动的自适应多代理系统研究

国家自然科学基金

3+阅读 · 2012年12月31日

不确定多智能体系统一致性的分布式自适应控制

国家自然科学基金

7+阅读 · 2012年12月31日

高阶奇异群系统一致性分析与综合

国家自然科学基金

0+阅读 · 2011年12月31日

基于多Agent的通信交互式动态影响图研究及应用

国家自然科学基金

2+阅读 · 2009年12月31日

基于机器学习的软件度量分析

国家自然科学基金

1+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于抽象解释的逻辑程序验证研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Domain-Specific Bias Filtering for Single Labeled Domain Generalization

Arxiv

0+阅读 · 2022年11月22日

Towards Human-Interpretable Prototypes for Visual Assessment of Image Classification Models

Arxiv

0+阅读 · 2022年11月22日

Quasi-stable Coloring for Graph Compression: Approximating Max-Flow, Linear Programs, and Centrality

Arxiv

0+阅读 · 2022年11月21日

Are All Combinations Equal? Combining Textual and Visual Features with Multiple Space Learning for Text-Based Video Retrieval

Arxiv

0+阅读 · 2022年11月21日

A Generalized EigenGame with Extensions to Multiview Representation Learning

Arxiv

0+阅读 · 2022年11月21日

VarietySound: Timbre-Controllable Video to Sound Generation via Unsupervised Information Disentanglement

Arxiv

0+阅读 · 2022年11月19日

Adv-Attribute: Inconspicuous and Transferable Adversarial Attack on Face Recognition

Arxiv

0+阅读 · 2022年11月18日

Domain Generalization in Vision: A Survey

Arxiv

17+阅读 · 2021年7月18日

Does William Shakespeare REALLY Write Hamlet? Knowledge Representation Learning with Confidence

Arxiv

10+阅读 · 2018年2月16日

Graph Convolutional Networks for Named Entity Recognition

Arxiv

17+阅读 · 2018年2月14日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员