【NeurIPS2022】通过模型转换的可解释强化学习 - 专知VIP

会员服务 ·

15

NeurIPS 2022 · 可解释强化学习 · 模型转换 ·

2022 年 10 月 4 日

【NeurIPS2022】通过模型转换的可解释强化学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

理解强化学习(RL)智能体的新出现行为可能是困难的，因为此类智能体通常在复杂环境中使用高度复杂的决策程序进行训练。这导致了强化学习中各种可解释性方法的产生，这些方法旨在协调智能体的行为和观察者预期的行为之间可能出现的差异。最近的大多数方法都依赖于领域知识(这可能并不总是可用的)，依赖于对智能体策略的分析，或者依赖于对底层环境的特定元素的分析(通常建模为马尔可夫决策过程(Markov Decision Process, MDP))。我们的关键主张是，即使底层的MDP不是完全已知的(例如，转移概率没有被准确地学习)或不是由智能体维护的(即，转移概率不是由智能体维护的)。，当使用无模型方法时)，它仍然可以被利用来自动生成解释。出于这个目的，我们建议使用正式的MDP抽象和转换(以前在文献中用于加速搜索最优策略)来自动生成解释。由于这种转换通常基于环境的符号表示，它们可以表示预期和实际智能体行为之间差距的有意义的解释。我们正式地定义了这个问题，提出了一类可以用来解释突发行为的变换，并提出了能够有效地寻找解释的方法。我们将在一组标准基准上演示该方法。

成为VIP会员查看完整内容

38

相关内容

NeurIPS 2022

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

专知会员服务

24+阅读 · 2022年11月8日

【NeurIPS2021】视觉语言导航的课程学习

【NeurIPS2021】视觉语言导航的课程学习

专知会员服务

24+阅读 · 2021年11月26日

【NeurIPS2021】对比主动推理

【NeurIPS2021】对比主动推理

专知会员服务

30+阅读 · 2021年10月21日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

专知

2+阅读 · 2022年11月8日

【NeurIPS2022】基于最大熵编码的自监督学习

【NeurIPS2022】基于最大熵编码的自监督学习

专知

1+阅读 · 2022年10月23日

【NeurIPS2021】视觉语言导航的课程学习

【NeurIPS2021】视觉语言导航的课程学习

专知

1+阅读 · 2021年11月26日

【NeurIPS2021】学习用于分布外预测的因果语义表示

【NeurIPS2021】学习用于分布外预测的因果语义表示

专知

1+阅读 · 2021年11月19日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知

0+阅读 · 2021年11月14日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

模型转换静态验证方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

实时领域交互行为模型转换方法及非功能语义规约研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于控制流模式的过程模型结构验证技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

可编程嵌入式系统形式化建模与自动验证技术的研究

国家自然科学基金

0+阅读 · 2009年12月31日

Simulator-based explanation and debugging of hazard-triggering events in DNN-based safety-critical systems

Arxiv

0+阅读 · 2022年11月8日

Geometry of VAS reachability sets

Arxiv

0+阅读 · 2022年11月5日

Planar Bipedal Locomotion with Nonlinear Model Predictive Control: Online Gait Generation using Whole-Body Dynamics

Arxiv

0+阅读 · 2022年11月3日

GAN Inversion: A Survey

Arxiv

19+阅读 · 2021年1月14日

已删除

Arxiv

33+阅读 · 2020年3月23日

VIP会员

相关主题

可解释强化学习

相关VIP内容

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

专知会员服务

24+阅读 · 2022年11月8日

【NeurIPS2021】视觉语言导航的课程学习

【NeurIPS2021】视觉语言导航的课程学习

专知会员服务

24+阅读 · 2021年11月26日

【NeurIPS2021】对比主动推理

【NeurIPS2021】对比主动推理

专知会员服务

30+阅读 · 2021年10月21日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

热门VIP内容

开通专知VIP会员享更多权益服务

前沿人工智能趋势报告（Frontier AI Trends Report）

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

音退化问题：基于输入操控的鲁棒语音转换综述

相关资讯

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

专知

2+阅读 · 2022年11月8日

【NeurIPS2022】基于最大熵编码的自监督学习

【NeurIPS2022】基于最大熵编码的自监督学习

专知

1+阅读 · 2022年10月23日

【NeurIPS2021】视觉语言导航的课程学习

【NeurIPS2021】视觉语言导航的课程学习

专知

1+阅读 · 2021年11月26日

【NeurIPS2021】学习用于分布外预测的因果语义表示

【NeurIPS2021】学习用于分布外预测的因果语义表示

专知

1+阅读 · 2021年11月19日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知

0+阅读 · 2021年11月14日

相关基金

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

模型转换静态验证方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

实时领域交互行为模型转换方法及非功能语义规约研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于控制流模式的过程模型结构验证技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

可编程嵌入式系统形式化建模与自动验证技术的研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Simulator-based explanation and debugging of hazard-triggering events in DNN-based safety-critical systems

Arxiv

0+阅读 · 2022年11月8日

Geometry of VAS reachability sets

Arxiv

0+阅读 · 2022年11月5日

Planar Bipedal Locomotion with Nonlinear Model Predictive Control: Online Gait Generation using Whole-Body Dynamics

Arxiv

0+阅读 · 2022年11月3日

GAN Inversion: A Survey

Arxiv

19+阅读 · 2021年1月14日

已删除

Arxiv

33+阅读 · 2020年3月23日

微信扫码咨询专知VIP会员