因果推理一直是科学的一部分，从牛顿定律到毁灭性的COVID-19大流行病，因果思想已经定义了基本科学。原因解释了 "为什么"，而结果则描述了"什么"。这个领域本身包含了大量的学科，从统计学和计算机科学到经济学和哲学。最近机器学习和人工智能系统的进步，使人们对从大量可用的观察数据中识别和估计因果关系重新产生了兴趣。这导致了各种新的研究，旨在提供识别和估计因果推断的新方法。我们包括一个详细的因果推断框架、方法和评价的分类法。还提供了关于安全因果关系的概述。阐述了公开的挑战，并描述了评估因果推断方法的稳健性的措施。本报告旨在对此类因果关系的研究进行全面综述。我们对因果关系框架进行了深入审查，并描述了不同的方法。

1 引言

因果概念，也被称为因果关系，自科学本身诞生以来就定义了基础科学。因果关系仍然是任何科学发现的核心，其中原因解释了 "为什么"，结果描述了 "什么"。因果关系经常被错误地与相关关系交替使用，尽管相关关系并不意味着因果关系。尽管相关关系对科学来说至关重要，但将相关关系错误地表述为因果关系会产生不利影响。例如，Covid-19和一些药物之间的相关性导致未经证实的关于可能治疗疾病的理论传播开来。相关性指的是两个具有特定趋势的变量之间的关系，而因果性是指因果关系，即因要对果负责，而果在一定程度上依赖于因。因此，因果学习是指从数据中产生因果关系的过程。因果关系在我们的日常生活中也发挥着重要的、无所不在的作用。我们做出的每一个决定都有一个因果变量，决定了我们的生活方式。因此，假设因果学习是任何人工智能（AI）或机器学习（ML）系统的关键组成部分，无论其在商业和军事应用中的用途如何，都是至关重要的。因果学习在过去20年内的研究活动有所增加，每年的出版物反映了因果研究的快速上升（图1）。

图 1 因果推理和因果关系的年度出版物（数据来自 Scopus）

过去十年中，人工智能/机器学习系统的最新进展使人工推理系统成为许多行业的前沿。随着AI/ML系统有望自主行动并显示出类似人类的智慧，仍然存在一些基本的挑战，如稳健性、可迁移性、可解释性和因果关系。虽然AI/ML系统在预测的准确性和精确性方面取得了巨大的成就，但它们本质上仍然是黑盒模型，因此缺乏对系统如何得出预测结果的解释。这给这类系统的使用带来了不必要的问题，有偏见的预测影响了人类的生活。这就产生了可解释人工智能（XAI），它被视为黑盒问题的解决方案，人工智能/ML系统能够向最终用户解释其决策过程。开发XAI系统的目标之一是，不仅要减轻来自模型本身的偏见，还要减轻来自用于预测的传入数据的偏见。算法/模型的偏差可以通过各种技术来识别和缓解，但数据本身的内在偏差则更难缓解。因此，因果关系对于识别和缓解人工智能系统的数据偏差至关重要。根据Judea Pearl博士的说法，因果关系可以让人工智能/ML系统 "编排其环境的解析和模块化表征，审问该表征，通过想象力的行为扭曲它，并最终回答'如果'类型的问题"。关于XAI的进一步阅读，我们建议读者回顾详细的调查，如Rawal等人、Gunning等人、Xu等人和Arrieta等人。

尽管有关于因果关系的相关调查和基础研究，如Judea Pearl、Morgan等人、Yao等人和Gianicolo等人的调查提供了很好的概述，但也需要一个最新的调查，不仅对因果关系，而且对其与AI/ML有关的目标和评价指标进行更全面的考察。本调查报告旨在通过提供一个全面的调查来填补文献的空白，该调查研究了因果关系从开发到评估的所有方面，并强调了最近在因果关系AI/ML系统方面取得的一些突破和进展。这项调查的主要贡献包括以下几点：