随着机器学习模型越来越多地用于在医疗保健和刑事司法等高风险环境中帮助决策者,确保决策者(最终用户)正确理解并因此信任这些模型的功能是很重要的。本报告旨在让学生熟悉可解释和可解释ML这一新兴领域的最新进展。在本报告中,我们将回顾该领域的重要论文,理解模型可解释和可解释的概念,详细讨论不同类别的可解释模型(如基于原型的方法、稀疏线性模型、基于规则的技术、广义可加性模型),事后解释(黑箱解释包括反事实解释和显著性图),并探索可解释性与因果关系、调试和公平性之间的联系。该课程还将强调各种应用,可以极大地受益于模型的可解释性,包括刑事司法和医疗保健。