【NTU博士论文】异构数据上机器学习模型的反事实解释，172页pdf

反事实解释旨在确定输入实例中所需的最小且有意义的变化，以产生与给定模型不同的预测。反事实解释可以帮助用户理解模型的当前预测，检测模型不公正，并为收到不希望预测的用户提供可操作的建议。因此，反事实解释在教育、金融、市场营销和医疗保健等领域有着多样的应用。 反事实解释问题被构建为一个受约束的优化问题，其目标是在满足某些约束的情况下最小化输入和反事实解释之间的成本。现有研究主要集中在两个领域：纳入实际约束和引入各种解决方法。然而，反事实解释距离实际部署还很远。在本论文中，我们从信任、可操作性和安全性的角度改进了这个问题，使反事实解释更易于部署。 反事实解释的一个目标是从模型中寻求行动建议。然而，常用的模型，如集成模型和神经网络，是黑盒子，信任度较低。解释模型可以提高模型的信任度。然而，全局解释过于笼统，无法适用于所有实例，而逐一检查所有局部解释也是一种负担。因此，我们提出了一种群体级汇总方法，该方法找到 k 个群组，每个群组通过特征重要性矩阵中不同的前-l 个重要特征进行汇总。这种方法提供了一个紧凑的总结，使模型更易于理解和检查。在现实生活应用中，使用标量成本函数比较异构特征中的变化是困难的。此外，现有方法不支持用户的交互式探索。为了解决这些问题，我们提出了一种天际线方法，将每个不可比较特征的变化视为一个最小化目标，并找到一组非支配的反事实解释。用户可以从这个非支配集中交互式地细化他们的要求。我们的实验表明，我们的方法与最先进的方法相比提供了更优越的结果。 对于希望部署反事实解释服务的模型所有者来说，模型的安全性和隐私性是关键的考虑因素。然而，这些问题在文献中尚未受到太多关注。为了弥补这一差距，我们提出了一种高效且有效的攻击方法，可以通过反事实解释（CFs）提取预训练模型。具体来说，我们的方法将 CFs 视为寻找反事实解释的反事实解释（CCFs）的常见查询，然后使用 CFs 和 CCFs 对的配对训练替代模型。实验表明，我们的方法可以获得具有更高一致性的替代模型。总之，我们的研究有助于弥合理论理解与反事实解释实际应用之间的研究差距，并为各个领域的研究人员和从业者提供宝贵的见解。

成为VIP会员查看完整内容

相关内容

博士论文

关注 126

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【斯坦福大学博士论文】生成式模型在现实世界应用中的进展，222页pdf

专知会员服务

74+阅读 · 2023年10月6日

【伯克利博士论文】受约束的机器学习：算法与模型，153页pdf

专知会员服务

54+阅读 · 2023年8月22日

【MIT博士论文】保证性生成模型，155页pdf

专知会员服务

31+阅读 · 2023年8月8日

【MIT博士论文】序列决策中的算法公平性，134页pdf

专知会员服务

25+阅读 · 2023年5月20日