因果推理一直是科学的一部分,从牛顿定律到毁灭性的COVID-19大流行病,因果思想已经定义了基本科学。原因解释了 "为什么",而结果则描述了"什么"。这个领域本身包含了大量的学科,从统计学和计算机科学到经济学和哲学。最近机器学习和人工智能系统的进步,使人们对从大量可用的观察数据中识别和估计因果关系重新产生了兴趣。这导致了各种新的研究,旨在提供识别和估计因果推断的新方法。我们包括一个详细的因果推断框架、方法和评价的分类法。还提供了关于安全因果关系的概述。阐述了公开的挑战,并描述了评估因果推断方法的稳健性的措施。本报告旨在对此类因果关系的研究进行全面综述。我们对因果关系框架进行了深入审查,并描述了不同的方法。

1 引言

因果概念,也被称为因果关系,自科学本身诞生以来就定义了基础科学。因果关系仍然是任何科学发现的核心,其中原因解释了 "为什么",结果描述了 "什么"。因果关系经常被错误地与相关关系交替使用,尽管相关关系并不意味着因果关系。尽管相关关系对科学来说至关重要,但将相关关系错误地表述为因果关系会产生不利影响。例如,Covid-19和一些药物之间的相关性导致未经证实的关于可能治疗疾病的理论传播开来。相关性指的是两个具有特定趋势的变量之间的关系,而因果性是指因果关系,即因要对果负责,而果在一定程度上依赖于因。因此,因果学习是指从数据中产生因果关系的过程。因果关系在我们的日常生活中也发挥着重要的、无所不在的作用。我们做出的每一个决定都有一个因果变量,决定了我们的生活方式。因此,假设因果学习是任何人工智能(AI)或机器学习(ML)系统的关键组成部分,无论其在商业和军事应用中的用途如何,都是至关重要的。因果学习在过去20年内的研究活动有所增加,每年的出版物反映了因果研究的快速上升(图1)。

图 1 因果推理和因果关系的年度出版物(数据来自 Scopus)

过去十年中,人工智能/机器学习系统的最新进展使人工推理系统成为许多行业的前沿。随着AI/ML系统有望自主行动并显示出类似人类的智慧,仍然存在一些基本的挑战,如稳健性、可迁移性、可解释性和因果关系。虽然AI/ML系统在预测的准确性和精确性方面取得了巨大的成就,但它们本质上仍然是黑盒模型,因此缺乏对系统如何得出预测结果的解释。这给这类系统的使用带来了不必要的问题,有偏见的预测影响了人类的生活。这就产生了可解释人工智能(XAI),它被视为黑盒问题的解决方案,人工智能/ML系统能够向最终用户解释其决策过程。开发XAI系统的目标之一是,不仅要减轻来自模型本身的偏见,还要减轻来自用于预测的传入数据的偏见。算法/模型的偏差可以通过各种技术来识别和缓解,但数据本身的内在偏差则更难缓解。因此,因果关系对于识别和缓解人工智能系统的数据偏差至关重要。根据Judea Pearl博士的说法,因果关系可以让人工智能/ML系统 "编排其环境的解析和模块化表征,审问该表征,通过想象力的行为扭曲它,并最终回答'如果'类型的问题"。关于XAI的进一步阅读,我们建议读者回顾详细的调查,如Rawal等人、Gunning等人、Xu等人和Arrieta等人。

尽管有关于因果关系的相关调查和基础研究,如Judea Pearl、Morgan等人、Yao等人和Gianicolo等人的调查提供了很好的概述,但也需要一个最新的调查,不仅对因果关系,而且对其与AI/ML有关的目标和评价指标进行更全面的考察。本调查报告旨在通过提供一个全面的调查来填补文献的空白,该调查研究了因果关系从开发到评估的所有方面,并强调了最近在因果关系AI/ML系统方面取得的一些突破和进展。这项调查的主要贡献包括以下几点

  • 我们通过关注该领域从设计和开发到评估的所有方面,对因果关系进行了详细的概述

  • 我们总结了因果关系的设计/开发和评估的综合分类法(第17页)

  • 我们提供了因果关系学习方法的比较

  • 我们提供了对网络安全使用因果关系的见解,并强调了最近在因果安全方面的一些进展

  • 我们对该领域仍然存在的挑战进行了公开讨论,并对解决这些挑战的建议提出了看法

本报告的结构如下。第2节介绍了分类法和对因果推断水平的见解。第3节对利用因果推理和因果发现的设计和开发方法进行了简要调查。第4节描述了用于测量因果AI/ML系统有效性的技术。第5节简要介绍了网络安全的因果关系。第6节讨论了因果关系研究中的公开挑战和当前趋势。第7节为总结性意见。

成为VIP会员查看完整内容
117

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《理解美陆军多域作战》2022最新17页报告,美国陆军协会
专知会员服务
118+阅读 · 2022年12月21日
最新《可解释机器学习》报告,164页ppt建模阐述XAI进展
专知会员服务
107+阅读 · 2022年8月25日
【综述】医疗可解释人工智能综述论文
专知
33+阅读 · 2019年7月18日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2013年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
国家自然科学基金
4+阅读 · 2008年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2023年1月24日
Arxiv
27+阅读 · 2023年1月12日
Arxiv
32+阅读 · 2021年3月8日
Arxiv
38+阅读 · 2020年3月10日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
《理解美陆军多域作战》2022最新17页报告,美国陆军协会
专知会员服务
118+阅读 · 2022年12月21日
最新《可解释机器学习》报告,164页ppt建模阐述XAI进展
专知会员服务
107+阅读 · 2022年8月25日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2013年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
国家自然科学基金
4+阅读 · 2008年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
相关论文
Arxiv
0+阅读 · 2023年1月24日
Arxiv
27+阅读 · 2023年1月12日
Arxiv
32+阅读 · 2021年3月8日
Arxiv
38+阅读 · 2020年3月10日
Arxiv
22+阅读 · 2018年8月30日
微信扫码咨询专知VIP会员