我们目前考虑所有的变量都是一维的实变量;给定一个合适的打分函数则可以直接扩展到多维变量的情形。在固定的函数和噪声分布下,我们的观测数据是根据上述模型在某个未知的 DAG 上独立采样得到。因果发现的目的就是使用这些观测的数据来推断真实的因果 DAG。
背景介绍
打分法是因果发现算法中一类常用的方法:给每个有向图打分(通常基于观测数据计算得到),然后在所有的 DAG 中进行搜索取得最好分数的 DAG:
尽管有很多已经深入研究的打分函数,例如基于线性高斯模型的 BIC/MDL 和 BGe 分数,但上述问题通常是 NP-hard 的,因为 DAG 条件是一个组合问题,并且可能的 DAG 数量的随着图节点的个数增加而超指数增加。为了解决这个问题,大多数已有方法都依赖于局部启发式算法。 例如,贪婪等价搜索(GES)在添加一条边时显式检查 DAG 约束是否满足。GES 在适当的假设和极限数据量的情况下可以找到具全局最优值,但在有限样本的情况下无法得到保证。