可解释机器学习发展和常见方法!

2020 年 12 月 6 日 深度学习自然语言处理

点击上方,选择星标置顶,每天给你送干货

阅读大概需要7分钟

跟随小博主,每天进步一丢丢

 干货 
来源:新智元,编辑:数据派THU
近年来,可解释机器学习(IML) 的相关研究蓬勃发展。尽管这个领域才刚刚起步,但是它在回归建模和基于规则的机器学习方面的相关工作却始于20世纪60年代。最近,arXiv上的一篇论文简要介绍了解释机器学习(IML)领域的历史,给出了最先进的可解释方法的概述,并讨论了遇到的挑战。


当机器学习模型用在产品、决策或者研究过程中的时候,“可解释性”通常是一个决定因素。

 

可解释机器学习(Interpretable machine learning ,简称 IML)可以用来来发现知识,调试、证明模型及其预测,以及控制和改进模型。

 

研究人员认为 IML的发展在某些情况下可以认为已经步入了一个新的阶段,但仍然存在一些挑战。

 


可解释机器学习(IML)简史

最近几年有很多关于可解释机器学习的相关研究, 但是从数据中学习可解释模型的历史由来已久。
 
线性回归早在19世纪初就已经被使用,从那以后又发展成各种各样的回归分析工具,例如,广义相加模型(generalized additive models)和弹性网络(elastic net)等。
 
这些统计模型背后的哲学意义通常是做出某些分布假设或限制模型的复杂性,并因此强加模型的内在可解释性。
 

而在机器学习中,使用的建模方法略有不同。 

机器学习算法通常遵循非线性,非参数方法,而不是预先限制模型的复杂性,在该方法中,模型的复杂性通过一个或多个超参数进行控制,并通过交叉验证进行选择。这种灵活性通常会导致难以解释的模型具有良好的预测性能。
 
虽然机器学习算法通常侧重于预测的性能,但关于机器学习的可解释性的工作已经存在了很多年。随机森林中内置的特征重要性度量是可解释机器学习的重要里程碑之一。
                
深度学习在经历了很长时间的发展后,终于在2010年的ImageNet中获胜。
 
从那以后的几年,根据Google上“可解释性机器学习”和“可解释的AI”这两个搜索词的出现频率,可以大概得出IML领域在2015年才真正起飞。
                
IML中的常见方法

通常会通过分析模型组件,模型敏感性或替代模型来区分IML方法。
                
分析可解释模型的成分
 
为了分析模型的组成部分,需要将其分解为可以单独解释的部分。但是,并不一定需要用户完全了解该模型。
                

通常可解释模型是具有可学习的结构和参数的模型,可以为其分配特定的解释。在这种情况下,线性回归模型,决策树和决策规则被认为是可解释的。
 
线性回归模型可以通过分析组件来解释:模型结构(特征的加权求和)允许将权重解释为特征对预测的影响。
 
分析更复杂模型的成分
 
研究人员还会分析更复杂的黑盒模型的组成部分。例如,可以通过查找或生成激活的CNN特征图的图像来可视化卷积神经网络(CNN)学习的抽象特征。
 
对于随机森林,通过树的最小深度分布和基尼系数来分析随机森林中的树,可以用来量化特征的重要性。


模型成分分析是一个不错的工具,但是它的缺点是与特定的模型相关, 而且它不能与常用的模型选择方法很好地结合,通常是通过机器学习搜索很多不同的ML模型进行交叉验证。
 
IML发展中遇到的挑战

统计不确定性
 
许多 IML 方法,例如:特征重要度的排列组合等,在不量化解释不确定性的情况下提供了解释。

模型本身以及其解释都是根据数据计算的,因此存在不确定性。目前研究正在努力量化解释的不确定性,例如对于特征重要性的逐层分析相关性等。
 
因果解释
 
理想情况下,模型应反映其潜在现象的真实因果结构,以进行因果解释。如果在科学中使用IML,则因果解释通常是建模的目标。
 
但是大多数统计学习程序仅反映特征之间的相关结构并分析数据的生成过程,而不是其真正的固有结构。 这样的因果结构也将使模型更强大地对抗攻击,并且在用作决策依据时更有用。


不幸的是,预测性能和因果关系可能是一种相互矛盾的目标。
 
例如,今天的天气直接导致明天的天气,但是我们可能只能使用“湿滑的地面”这个信息,在预测模型中使用“湿滑的地面”来表示明天的天气很有用,因为它含有今天的天气的信息,但由于ML模型中缺少了今天的天气信息,因此不能对其进行因果解释。
 
特征依赖
 
特征之间的依赖引入了归因和外推问题。 例如,当特征之间相互关联并共享信息时,特征的重要性和作用就变得难以区分。
 
随机森林中的相关特征具有较高的重要性,许多基于灵敏度分析的方法会置换特征,当置换后的特征与另一特征具有某种依赖性时,此关联将断开,并且所得数据点将外推到分布之外的区域。
               

ML模型从未在这类组合数据上进行过训练,并且可能不会在应用程序中遇到类似的数据点。因此,外推可能会引起误解。
 
如何向具有不同知识和背景的个人解释预测结果,以及满足有关机构或社会层面的可解释性的需求可能是IML今后的目标。

它涵盖了更广泛的领域,例如人机交互,心理学和社会学等。为了解决未来的挑战,作者认为可解释机器学习领域必须横向延伸到其他领域,并在统计和计算机科学方面纵向延伸。
 
参考链接:

https://arxiv.org/abs/2010.09337


   
   
     
下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套!
后台回复【五件套


下载二:南大模式识别PPT
后台回复南大模式识别



说个正事哈



由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心



投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等

记得备注呦


推荐两个专辑给大家:
专辑 | 李宏毅人类语言处理2020笔记
专辑 | NLP论文解读
专辑 | 情感分析

整理不易,还望给个在看!

登录查看更多
4

相关内容

可解释性是指一个人能够持续预测模型结果的程度。机器学习模型的可解释性越高,人们就越容易理解为什么做出某些决定或预测。
最新《监督机器学习可解释性》2020大综述论文,74页pdf
专知会员服务
129+阅读 · 2020年11月19日
最新《可解释机器学习:原理与实践》综述论文,33页pdf
专知会员服务
159+阅读 · 2020年10月10日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
179+阅读 · 2020年9月7日
机器学习的可解释性
专知会员服务
175+阅读 · 2020年8月27日
专知会员服务
219+阅读 · 2020年8月1日
从锚点到关键点,最新的目标检测方法发展趋势
计算机视觉life
17+阅读 · 2019年8月20日
【综述】医疗可解释人工智能综述论文
专知
33+阅读 · 2019年7月18日
干货 | 可解释的机器学习
AI科技评论
20+阅读 · 2019年7月3日
【学界】机器学习模型的“可解释性”到底有多重要?
GAN生成式对抗网络
12+阅读 · 2018年3月3日
2017深度学习NLP进展与趋势
云栖社区
7+阅读 · 2017年12月17日
Arxiv
12+阅读 · 2020年8月3日
Deep Co-Training for Semi-Supervised Image Segmentation
Arxiv
16+阅读 · 2018年2月7日
VIP会员
相关资讯
从锚点到关键点,最新的目标检测方法发展趋势
计算机视觉life
17+阅读 · 2019年8月20日
【综述】医疗可解释人工智能综述论文
专知
33+阅读 · 2019年7月18日
干货 | 可解释的机器学习
AI科技评论
20+阅读 · 2019年7月3日
【学界】机器学习模型的“可解释性”到底有多重要?
GAN生成式对抗网络
12+阅读 · 2018年3月3日
2017深度学习NLP进展与趋势
云栖社区
7+阅读 · 2017年12月17日
Top
微信扫码咨询专知VIP会员