【ICML2023】知识蒸馏对模型可解释性的影响 - 专知VIP

会员服务 ·

21

知识蒸馏 · 模型可解释性 ·

2023 年 5 月 27 日

【ICML2023】知识蒸馏对模型可解释性的影响

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

最近的一些研究阐明了为什么知识蒸馏(KD)可以提高模型性能。然而，KD算法除了能提高模型性能外，还具有其他优点，目前研究较少。在这项研究中，我们试图表明KD增强了模型的可解释性和准确性。我们测量了网络解剖中识别的概念检测器的数量，以定量比较模型的可解释性。我们将可解释性的提高归因于从教师模型传递到学生模型的类相似度信息。首先，通过logit蒸馏确定类相似度信息从教师模型向学生模型的迁移;然后，从类相似信息的存在与否和相似信息的程度两个方面分析了类相似信息对模型可解释性的影响;我们进行了各种定量和定性的实验，并根据不同的数据集、不同的KD方法和不同的可解释性度量检查了结果。我们的研究表明，由大型模型组成的KD模型可以更可靠地应用于各种领域。

成为VIP会员查看完整内容

37

相关内容

知识蒸馏

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

专知会员服务

24+阅读 · 2022年6月10日

医学诊断如何可解释？贝拉内大学最新《医学诊断中可解释深度学习方法》综述，36页pdf153篇文献概述最新XAI医学诊断进展

医学诊断如何可解释？贝拉内大学最新《医学诊断中可解释深度学习方法》综述，36页pdf153篇文献概述最新XAI医学诊断进展

专知会员服务

91+阅读 · 2022年5月14日

【WWW2022】学习和评估基于反事实和事实推理的图神经网络解释

【WWW2022】学习和评估基于反事实和事实推理的图神经网络解释

专知会员服务

52+阅读 · 2022年2月20日

【AAAI2022】联合文本分类和关系提取的统一模型可解释性和鲁棒性

【AAAI2022】联合文本分类和关系提取的统一模型可解释性和鲁棒性

专知会员服务

19+阅读 · 2021年12月30日

【ICML2021】无训练神经架构搜索

专知会员服务

20+阅读 · 2021年9月16日

【KDD 2021】算法公平性解释框架FACTS

专知会员服务

24+阅读 · 2021年8月27日

【ICML2021】具有超参数重要性的可解释的自动图表示学习

专知会员服务

25+阅读 · 2021年7月18日

【ICML2021】基于子图结构的GNN解释模型

专知会员服务

50+阅读 · 2021年6月2日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

129+阅读 · 2019年10月12日

从NeurIPS 2022看域泛化：大规模实验分析和模型平均

从NeurIPS 2022看域泛化：大规模实验分析和模型平均

PaperWeekly

0+阅读 · 2022年10月23日

【牛津大学博士论文】鲁棒神经网络:评估与构建

【牛津大学博士论文】鲁棒神经网络:评估与构建

专知

1+阅读 · 2022年10月23日

TAMU最新《图神经网络可解释》综述论文，19页pdf阐述实例级与模型级解释

TAMU最新《图神经网络可解释》综述论文，19页pdf阐述实例级与模型级解释

专知

1+阅读 · 2022年8月23日

「深度学习中知识蒸馏」最新2022研究综述

「深度学习中知识蒸馏」最新2022研究综述

专知

7+阅读 · 2022年8月14日

ICML 2022 | 基于随机注意力机制的可解释可泛化图学习

ICML 2022 | 基于随机注意力机制的可解释可泛化图学习

PaperWeekly

1+阅读 · 2022年8月10日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

基于知识蒸馏的BERT模型压缩

基于知识蒸馏的BERT模型压缩

大数据文摘

18+阅读 · 2019年10月14日

【综述】医疗可解释人工智能综述论文

【综述】医疗可解释人工智能综述论文

专知

33+阅读 · 2019年7月18日

注意力能提高模型可解释性？实验表明：并没有

注意力能提高模型可解释性？实验表明：并没有

黑龙江大学自然语言处理实验室

11+阅读 · 2019年4月16日

【最新综述】无监督网络表示学习综述，附18页全文下载

【最新综述】无监督网络表示学习综述，附18页全文下载

专知

28+阅读 · 2019年3月20日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

随机变量结构的模型论

国家自然科学基金

0+阅读 · 2013年12月31日

条件独立性及其相关假设：基于特征函数的计量检验和实证研究

国家自然科学基金

3+阅读 · 2013年12月31日

基于有机质富集差异的湖相未熟富有机质泥页岩导电机理与解释模型

国家自然科学基金

0+阅读 · 2013年12月31日

加锚层状洞室围岩中爆炸扰动效应的作用机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

超声辐照联合微泡生物学效应对肿瘤局部化疗微环境影响及其机制的实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

适配体分子探针的信号放大新策略研究

国家自然科学基金

0+阅读 · 2012年12月31日

具有三维导电网络和多尺度孔道的石墨烯/介孔碳复合材料的制备及其超级电容性能研究

国家自然科学基金

0+阅读 · 2012年12月31日

应用生物标记物氢同位素探索南海表层古盐度

国家自然科学基金

0+阅读 · 2009年12月31日

LINFA: a Python library for variational inference with normalizing flow and annealing

Arxiv

0+阅读 · 2023年7月14日

Ageing Analysis of Embedded SRAM on a Large-Scale Testbed Using Machine Learning

Arxiv

0+阅读 · 2023年7月13日

Local Implicit Normalizing Flow for Arbitrary-Scale Image Super-Resolution

Arxiv

0+阅读 · 2023年7月13日

Multi-objective Evolutionary Search of Variable-length Composite Semantic Perturbations

Arxiv

0+阅读 · 2023年7月13日

Distilling Large Language Models for Biomedical Knowledge Extraction: A Case Study on Adverse Drug Events

Arxiv

0+阅读 · 2023年7月12日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

213+阅读 · 2023年4月7日

Data-Free Knowledge Transfer: A Survey

Arxiv

21+阅读 · 2021年12月31日

Graph Neural Network for Traffic Forecasting: A Survey

Arxiv

35+阅读 · 2021年1月27日

Deep Neural Network Based Relation Extraction: An Overview

Arxiv

14+阅读 · 2021年1月6日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

VIP会员

相关主题

模型可解释性

相关VIP内容

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

专知会员服务

24+阅读 · 2022年6月10日

医学诊断如何可解释？贝拉内大学最新《医学诊断中可解释深度学习方法》综述，36页pdf153篇文献概述最新XAI医学诊断进展

医学诊断如何可解释？贝拉内大学最新《医学诊断中可解释深度学习方法》综述，36页pdf153篇文献概述最新XAI医学诊断进展

专知会员服务

91+阅读 · 2022年5月14日

【WWW2022】学习和评估基于反事实和事实推理的图神经网络解释

【WWW2022】学习和评估基于反事实和事实推理的图神经网络解释

专知会员服务

52+阅读 · 2022年2月20日

【AAAI2022】联合文本分类和关系提取的统一模型可解释性和鲁棒性

【AAAI2022】联合文本分类和关系提取的统一模型可解释性和鲁棒性

专知会员服务

19+阅读 · 2021年12月30日

【ICML2021】无训练神经架构搜索

专知会员服务

20+阅读 · 2021年9月16日

【KDD 2021】算法公平性解释框架FACTS

专知会员服务

24+阅读 · 2021年8月27日

【ICML2021】具有超参数重要性的可解释的自动图表示学习

专知会员服务

25+阅读 · 2021年7月18日

【ICML2021】基于子图结构的GNN解释模型

专知会员服务

50+阅读 · 2021年6月2日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

129+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于大型语言模型的软件工程自动化研究》最新264页

《基于大型语言模型的信号处理管线研究：推进军事电子情报工作流程》最新76页

中文版 | 战争算法：生成式人工智能在战场的崛起

中文版《美国陆军：战术行为性远程医疗实施观察与建议》

相关资讯

从NeurIPS 2022看域泛化：大规模实验分析和模型平均

从NeurIPS 2022看域泛化：大规模实验分析和模型平均

PaperWeekly

0+阅读 · 2022年10月23日

【牛津大学博士论文】鲁棒神经网络:评估与构建

【牛津大学博士论文】鲁棒神经网络:评估与构建

专知

1+阅读 · 2022年10月23日

TAMU最新《图神经网络可解释》综述论文，19页pdf阐述实例级与模型级解释

TAMU最新《图神经网络可解释》综述论文，19页pdf阐述实例级与模型级解释

专知

1+阅读 · 2022年8月23日

「深度学习中知识蒸馏」最新2022研究综述

「深度学习中知识蒸馏」最新2022研究综述

专知

7+阅读 · 2022年8月14日

ICML 2022 | 基于随机注意力机制的可解释可泛化图学习

ICML 2022 | 基于随机注意力机制的可解释可泛化图学习

PaperWeekly

1+阅读 · 2022年8月10日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

基于知识蒸馏的BERT模型压缩

基于知识蒸馏的BERT模型压缩

大数据文摘

18+阅读 · 2019年10月14日

【综述】医疗可解释人工智能综述论文

【综述】医疗可解释人工智能综述论文

专知

33+阅读 · 2019年7月18日

注意力能提高模型可解释性？实验表明：并没有

注意力能提高模型可解释性？实验表明：并没有

黑龙江大学自然语言处理实验室

11+阅读 · 2019年4月16日

【最新综述】无监督网络表示学习综述，附18页全文下载

【最新综述】无监督网络表示学习综述，附18页全文下载

专知

28+阅读 · 2019年3月20日

相关基金

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

随机变量结构的模型论

国家自然科学基金

0+阅读 · 2013年12月31日

条件独立性及其相关假设：基于特征函数的计量检验和实证研究

国家自然科学基金

3+阅读 · 2013年12月31日

基于有机质富集差异的湖相未熟富有机质泥页岩导电机理与解释模型

国家自然科学基金

0+阅读 · 2013年12月31日

加锚层状洞室围岩中爆炸扰动效应的作用机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

超声辐照联合微泡生物学效应对肿瘤局部化疗微环境影响及其机制的实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

适配体分子探针的信号放大新策略研究

国家自然科学基金

0+阅读 · 2012年12月31日

具有三维导电网络和多尺度孔道的石墨烯/介孔碳复合材料的制备及其超级电容性能研究

国家自然科学基金

0+阅读 · 2012年12月31日

应用生物标记物氢同位素探索南海表层古盐度

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

LINFA: a Python library for variational inference with normalizing flow and annealing

Arxiv

0+阅读 · 2023年7月14日

Ageing Analysis of Embedded SRAM on a Large-Scale Testbed Using Machine Learning

Arxiv

0+阅读 · 2023年7月13日

Local Implicit Normalizing Flow for Arbitrary-Scale Image Super-Resolution

Arxiv

0+阅读 · 2023年7月13日

Multi-objective Evolutionary Search of Variable-length Composite Semantic Perturbations

Arxiv

0+阅读 · 2023年7月13日

Distilling Large Language Models for Biomedical Knowledge Extraction: A Case Study on Adverse Drug Events

Arxiv

0+阅读 · 2023年7月12日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

213+阅读 · 2023年4月7日

Data-Free Knowledge Transfer: A Survey

Arxiv

21+阅读 · 2021年12月31日

Graph Neural Network for Traffic Forecasting: A Survey

Arxiv

35+阅读 · 2021年1月27日

Deep Neural Network Based Relation Extraction: An Overview

Arxiv

14+阅读 · 2021年1月6日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

微信扫码咨询专知VIP会员