广义上的可解释性指在我们需要了解或解决一件事情的时候,我们可以获得我们所需要的足够的可以理解的信息,也就是说一个人能够持续预测模型结果的程度。按照可解释性方法进行的过程进行划分的话,大概可以划分为三个大类: 在建模之前的可解释性方法,建立本身具备可解释性的模型,在建模之后使用可解释性方法对模型作出解释。
112页《人工智能对齐:全面性综述》中文版
专知会员服务
139+阅读 · 2月1日
【博士论文】可解释深度学习的结构化表示,119页pdf
专知会员服务
61+阅读 · 2023年12月18日
【慕尼黑大学博士论文】可解释自动化机器学习,200页pdf
专知会员服务
36+阅读 · 2023年12月17日
【2023新书】可解释强化学习,68页pdf
专知会员服务
74+阅读 · 2023年8月25日
参考链接
微信扫码咨询专知VIP会员