【ICML2022】XAI for Transformers:通过保守传播更好的解释 - 专知VIP

会员服务 ·

7

XAI · Transformers · ICML 2022 ·

2022 年 7 月 19 日

【ICML2022】XAI for Transformers:通过保守传播更好的解释

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Transformers已经成为机器学习的重要主力，有着众多的应用。这就需要制定可靠的方法来增加其透明度。人们提出了多种基于梯度信息的可解释性方法。我们表明，Transformers中的梯度仅反映局部函数，因此不能可靠地识别输入特征对预测的贡献。我们认为引起这种不可靠解释的主要原因是注意力头和LayerNorm，并提出了一种通过这些层传播的更稳定的方式。我们的建议可以被视为对已建立的LRP方法的适当扩展，在理论上和经验上都证明了该方法克服了简单的基于梯度的方法的缺陷，并在广泛的Transformer模型和数据集上实现了最先进的解释性能。

https://proceedings.mlr.press/v162/ali22a.html

成为VIP会员查看完整内容

16

相关内容

XAI

【ICML2022】通过能量最小化学习迭代推理

【ICML2022】通过能量最小化学习迭代推理

专知会员服务

26+阅读 · 2022年7月3日

【ICML2022】结构感知Transformer的图表示学习

【ICML2022】结构感知Transformer的图表示学习

专知会员服务

49+阅读 · 2022年6月17日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

56+阅读 · 2022年6月15日

【ICML2022】图神经网络异常检测的再思考

【ICML2022】图神经网络异常检测的再思考

专知会员服务

35+阅读 · 2022年6月3日

【ICML2022】深度神经网络中的特征学习与信号传播

【ICML2022】深度神经网络中的特征学习与信号传播

专知会员服务

26+阅读 · 2022年6月2日

【ICML2021】蛋白质语言模型-MSA Transformer

专知会员服务

34+阅读 · 2021年8月16日

[ICML2021]. GRAND：图神经扩散

专知会员服务

27+阅读 · 2021年7月11日

【ICML2021】SparseBERT: 自注意力机制的重要性分析再思考

专知会员服务

37+阅读 · 2021年5月15日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【AAAI2021】可解释图胶囊网络物体检测

【AAAI2021】可解释图胶囊网络物体检测

专知会员服务

29+阅读 · 2021年1月4日

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知

1+阅读 · 2022年7月22日

【ICML2022】深度神经网络中的特征学习与信号传播

【ICML2022】深度神经网络中的特征学习与信号传播

专知

0+阅读 · 2022年6月2日

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

专知

1+阅读 · 2022年5月30日

AAAI 2022 | 可解释和鲁棒的联合文本分类及证据提取

AAAI 2022 | 可解释和鲁棒的联合文本分类及证据提取

PaperWeekly

1+阅读 · 2022年3月17日

在注意力中重新思考Softmax：分解非线性，这个线性Transformer变体实现多项SOTA

在注意力中重新思考Softmax：分解非线性，这个线性Transformer变体实现多项SOTA

PaperWeekly

0+阅读 · 2022年2月25日

IJCAI'21 | 理解GNN的"弱点"

IJCAI'21 | 理解GNN的"弱点"

图与推荐

0+阅读 · 2021年11月26日

赛尔笔记 | 可解释的自然语言处理方法简介

赛尔笔记 | 可解释的自然语言处理方法简介

哈工大SCIR

3+阅读 · 2021年5月28日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

赛尔笔记 | Attention！注意力机制可解释吗？

赛尔笔记 | Attention！注意力机制可解释吗？

哈工大SCIR

23+阅读 · 2019年9月27日

卷积神经网络的最佳解释！

卷积神经网络的最佳解释！

专知

12+阅读 · 2018年5月1日

树上生灭过程收敛速度及p-Laplacian特征值估计

国家自然科学基金

0+阅读 · 2015年12月31日

力电脉冲作用下压电陶瓷疲劳裂纹扩展模拟与实验验证

国家自然科学基金

0+阅读 · 2014年12月31日

球面波反射和透射系数频变机制研究及考虑频变的地层Q值估计

国家自然科学基金

0+阅读 · 2013年12月31日

压弯剪扭复合受力下加固RC震损柱二次地震破坏机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

超广角单程波传播算子的精度改进与成像研究

国家自然科学基金

0+阅读 · 2012年12月31日

华北地区板内大地震时空迁移的数值模拟

国家自然科学基金

0+阅读 · 2012年12月31日

甲型流感与艾滋病协同感染的数学模型的动力学研究

国家自然科学基金

0+阅读 · 2012年12月31日

土壤和裂隙介质中反常扩散的分数阶变导数建模

国家自然科学基金

0+阅读 · 2012年12月31日

针对页岩储层的多波地震各向异性预测方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂网络上的人口演化传染病动力学性态研究

国家自然科学基金

1+阅读 · 2011年12月31日

Model- and Acceleration-based Pursuit Controller for High-Performance Autonomous Racing

Model- and Acceleration-based Pursuit Controller for High-Performance Autonomous Racing

Arxiv

0+阅读 · 2022年9月9日

OmniXAI: A Library for Explainable AI

Arxiv

0+阅读 · 2022年9月8日

UniLMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Training

Arxiv

15+阅读 · 2020年2月28日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Latent Relation Language Models

Arxiv

21+阅读 · 2019年8月21日

DAGCN: Dual Attention Graph Convolutional Networks

Arxiv

16+阅读 · 2019年4月4日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Explainable Reasoning over Knowledge Graphs for Recommendation

Arxiv

11+阅读 · 2018年11月12日

Variational Knowledge Graph Reasoning

Arxiv

15+阅读 · 2018年4月5日

VQA-E: Explaining, Elaborating, and Enhancing Your Answers for Visual Questions

Arxiv

17+阅读 · 2018年3月20日

VIP会员

相关主题

相关VIP内容

【ICML2022】通过能量最小化学习迭代推理

【ICML2022】通过能量最小化学习迭代推理

专知会员服务

26+阅读 · 2022年7月3日

【ICML2022】结构感知Transformer的图表示学习

【ICML2022】结构感知Transformer的图表示学习

专知会员服务

49+阅读 · 2022年6月17日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

56+阅读 · 2022年6月15日

【ICML2022】图神经网络异常检测的再思考

【ICML2022】图神经网络异常检测的再思考

专知会员服务

35+阅读 · 2022年6月3日

【ICML2022】深度神经网络中的特征学习与信号传播

【ICML2022】深度神经网络中的特征学习与信号传播

专知会员服务

26+阅读 · 2022年6月2日

【ICML2021】蛋白质语言模型-MSA Transformer

专知会员服务

34+阅读 · 2021年8月16日

[ICML2021]. GRAND：图神经扩散

专知会员服务

27+阅读 · 2021年7月11日

【ICML2021】SparseBERT: 自注意力机制的重要性分析再思考

专知会员服务

37+阅读 · 2021年5月15日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【AAAI2021】可解释图胶囊网络物体检测

【AAAI2021】可解释图胶囊网络物体检测

专知会员服务

29+阅读 · 2021年1月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《巡飞弹药（爆炸性无人机）威胁态势分析》最新24页报告

《军用后勤无人机：破解战场运输挑战的创新方案》

人工智能战争：以色列、伊朗与新型AI战争形态

《俄乌战争：现代战争未来的启示与经验》

相关资讯

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知

1+阅读 · 2022年7月22日

【ICML2022】深度神经网络中的特征学习与信号传播

【ICML2022】深度神经网络中的特征学习与信号传播

专知

0+阅读 · 2022年6月2日

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

专知

1+阅读 · 2022年5月30日

AAAI 2022 | 可解释和鲁棒的联合文本分类及证据提取

AAAI 2022 | 可解释和鲁棒的联合文本分类及证据提取

PaperWeekly

1+阅读 · 2022年3月17日

在注意力中重新思考Softmax：分解非线性，这个线性Transformer变体实现多项SOTA

在注意力中重新思考Softmax：分解非线性，这个线性Transformer变体实现多项SOTA

PaperWeekly

0+阅读 · 2022年2月25日

IJCAI'21 | 理解GNN的"弱点"

IJCAI'21 | 理解GNN的"弱点"

图与推荐

0+阅读 · 2021年11月26日

赛尔笔记 | 可解释的自然语言处理方法简介

赛尔笔记 | 可解释的自然语言处理方法简介

哈工大SCIR

3+阅读 · 2021年5月28日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

赛尔笔记 | Attention！注意力机制可解释吗？

赛尔笔记 | Attention！注意力机制可解释吗？

哈工大SCIR

23+阅读 · 2019年9月27日

卷积神经网络的最佳解释！

卷积神经网络的最佳解释！

专知

12+阅读 · 2018年5月1日

相关基金

树上生灭过程收敛速度及p-Laplacian特征值估计

国家自然科学基金

0+阅读 · 2015年12月31日

力电脉冲作用下压电陶瓷疲劳裂纹扩展模拟与实验验证

国家自然科学基金

0+阅读 · 2014年12月31日

球面波反射和透射系数频变机制研究及考虑频变的地层Q值估计

国家自然科学基金

0+阅读 · 2013年12月31日

压弯剪扭复合受力下加固RC震损柱二次地震破坏机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

超广角单程波传播算子的精度改进与成像研究

国家自然科学基金

0+阅读 · 2012年12月31日

华北地区板内大地震时空迁移的数值模拟

国家自然科学基金

0+阅读 · 2012年12月31日

甲型流感与艾滋病协同感染的数学模型的动力学研究

国家自然科学基金

0+阅读 · 2012年12月31日

土壤和裂隙介质中反常扩散的分数阶变导数建模

国家自然科学基金

0+阅读 · 2012年12月31日

针对页岩储层的多波地震各向异性预测方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂网络上的人口演化传染病动力学性态研究

国家自然科学基金

1+阅读 · 2011年12月31日

相关论文

Model- and Acceleration-based Pursuit Controller for High-Performance Autonomous Racing

Model- and Acceleration-based Pursuit Controller for High-Performance Autonomous Racing

Arxiv

0+阅读 · 2022年9月9日

OmniXAI: A Library for Explainable AI

Arxiv

0+阅读 · 2022年9月8日

UniLMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Training

Arxiv

15+阅读 · 2020年2月28日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Latent Relation Language Models

Arxiv

21+阅读 · 2019年8月21日

DAGCN: Dual Attention Graph Convolutional Networks

Arxiv

16+阅读 · 2019年4月4日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Explainable Reasoning over Knowledge Graphs for Recommendation

Arxiv

11+阅读 · 2018年11月12日

Variational Knowledge Graph Reasoning

Arxiv

15+阅读 · 2018年4月5日

VQA-E: Explaining, Elaborating, and Enhancing Your Answers for Visual Questions

Arxiv

17+阅读 · 2018年3月20日

微信扫码咨询专知VIP会员