【导读】人工智能顶级会议AAAI2021接收结果已经公布,本次AAAI 2021一共收到9034篇论文提交,其中有效审稿的只有7911篇,最终录取的数量为1692篇,接收率为21.4%,相比去年的20.6%高0.8%,竞争越来越激烈。近期,所有paper list 放出,小编发现基于因果推理(Causal Inference)相关的投稿paper很多,因果推理,以及反事实等相关理论方法在CV、NLP都开始有相关的应用了,这个前沿的方法受到了很多人的关注。
为此,这期小编为大家奉上AAAI 2021必读的六篇因果推理相关论文——故事情节生成、反事实公平性、定向因果图、元因果学习、算法公平性
AAAI 2021 Accepted Papers : https://aaai.org/Conferences/AAAI-21/wp-content/uploads/2020/12/AAAI-21_Accepted-Paper-List.Main_.Technical.Track_.pdf
ICLR2020CI、ICML2020CI
1. Automated Storytelling via Causal, Commonsense Plot Ordering
作者:Prithviraj Ammanabrolu, Wesley Cheung, William Broniec, Mark O. Riedl
摘要:故事情节的自动生成是一个生成情节事件连贯序列的任务。人们认为,情节事件之间的因果关系会增加对故事和情节连贯性的认识。在这项工作中,我们引入软因果关系(soft causal relations)的概念,这是从常识推理中得出的因果关系。我们提出了C2PO,一种叙事生成方法,通过因果关系,常识性情节排序(Commonsense Plot Ordering)来实现此概念。使用人类参与协议(human-participant protocols),我们使用具有不同常识性推理方法和归纳性偏差的基准系统评估我们的系统,以确定软因果关系在感知故事质量中的作用。通过这些研究,我们还探讨了不同叙事类型的常识性规范的变化如何影响故事质量的感知。
代码:
https://github.com/rajammanabrolu/C2PO
网址:
https://arxiv.org/abs/2009.00829
2. Counterfactual Fairness with Disentangled Causal Effect Variational Autoencoder
作者:Hyemi Kim, Seungjae Shin, JoonHo Jang, Kyungwoo Song, Weonyoung Joo, Wanmo Kang, Il-Chul Moon
摘要:如果我们提出一种从分类特征中删除嵌入的敏感信息的方法,则可以缓解公平分类的问题。区分敏感信息的这条研究线是通过因果推理而建立的,因果推理使反事实世代(counterfactual generations)能够对比相反敏感属性的假设情况。随着因果关系的分离,深层潜在因果模型中的一个常见假设定义了一个单个潜在变量来吸收因果图的整个外生不确定性。但是,这种结构无法从数据中区分出1)干预(intervention)引起的信息(即敏感变量)和2)与干预相关的信息。因此,本文提出了解因果效应变量自编码器(DCEVAE),通过将外部不确定性分解为两个潜在变量来解决这一局限性:1)独立于干预措施或2)与无因果关系的干预措施相关。特别地,我们的解缠方法保留了与生成反事实示例的干预措施相关的潜在变量。我们证明了我们的方法在没有完整因果图的情况下估计了总体效果和反事实效果。通过添加公平正则化,DCEVAE可以生成反事实公平数据集,同时减少了原始信息。而且,DCEVAE仅通过翻转敏感信息即可生成自然的反事实图像。此外,我们从潜在的纠缠的角度从理论上展示了DCEVAE和先前工作的协方差结构的差异。
网址:
https://arxiv.org/abs/2011.11878
3. Discovering Fully Oriented Causal Networks
作者:Osman Mian, Alexander Marx and Jilles Vreeken
摘要:我们研究了从观测数据推断因果图的问题。我们对发现所有边缘是定向的图特别感兴趣,这与最新技术发现的部分有向图相反。为此,我们的方法基于算法马尔可夫条件。与统计马尔可夫条件不同,它唯一地标识了真正的因果网络,因为它是最简单的联合分布因式分解(以Kolmogorov复杂性衡量)。尽管Kolmogorov复杂度无法计算,但我们可以通过最小描述长度原理从上方进行近似,这使我们能够基于非参数多元回归定义一致且可计算的得分。为了在实践中有效地发现因果网络,我们引入了GLOBE算法,该算法贪婪地添加,移除和定向边缘,以使总损失最小化。通过广泛的实验,我们证明了GLOBE在实践中表现非常出色,略微领先于最新技术。
网址:
http://eda.mmci.uni-saarland.de/pubs/2021/globe-mian,marx,vreeken.pdf
4. Meta learning for Causal Direction
作者:Jean-Francois Ton, Dino Sejdinovic, Kenji Fukumizu
摘要:由于许多科学领域的固有局限性,导致无法进行随机对照试验一直是因果推理的基本问题。在本文中,我们专注于在有限的观测数据下,在双变量环境中区分原因和结果。基于元学习和因果推理的最新发展,我们介绍了一种新颖的生成模型,该模型可以在小数据设置中区分因果关系。使用包含每个数据集分布信息的学习任务变量,我们提出了一种端到端算法,该算法在测试时使用了类似的训练数据集。我们在各种合成数据和现实数据中展示了我们的方法,并表明它能够在检测不同数据集大小的方向时保持高精度。
网址:
https://arxiv.org/abs/2007.02809
5. Equivalent Causal Models
作者:Sander Beckers
摘要:本文的目的是在两个模型都不由相同变量组成的情况下,提供对等价因果模型的第一个系统性探索和定义。我们的想法是,当两个模型都可以使用其公共变量表示的所有“基本”因果信息时,它们是等效的。为此,我着眼于因果模型的两个主要特征,即它们的结构关系和特征关系。特别是,我定义了因果关系的几个关系和因果充分性的几个关系,并要求这些关系中最笼统的关系在等效模型中保留。
网址:
https://arxiv.org/abs/2012.05603
6. The Importance of Modeling Data Missingness in Algorithmic Fairness: A Causal Perspective
作者:Naman Goel, Alfonso Amayuelas, Amit Deshpande, Amit Sharma
摘要:用于机器学习的训练数据集通常具有某种形式的缺失。例如,要学习用于确定向谁贷款的模型,可用的训练数据包括过去曾获得贷款的个人,而不是那些没有得到贷款的个人。如果忽略了这种缺失,那么在部署模型时,训练过程的任何公平性保证都将无效。我们使用因果图,描述了不同现实情况下的缺失机制。我们展示了在何种条件下能够或者不能从训练数据中恢复流行的公平算法中使用的各种分布。我们的理论结果表明,这些算法中有许多不能保证实践中的公平。对缺失进行建模还有助于确定公平算法的正确设计原理。例如,在多阶段设置中,在多个筛选回合中做出决策,我们使用我们的框架来得出设计公平算法所需的最小分布。我们提出的算法分散了决策过程,并且仍然实现了与需要集中化和不可恢复分布的最优算法相似的性能。