Inference of directed relations given some unspecified interventions, that is, the target of each intervention is not known, is important yet challenging. For instance, it is of high interest to unravel the regulatory roles of genes with inherited genetic variants like single-nucleotide polymorphisms (SNPs), which can be unspecified interventions because of their regulatory function on some unknown genes. In this article, we test hypothesized directed relations with unspecified interventions. First, we derive conditions to yield an identifiable model. Unlike classical inference, hypothesis testing requires identifying ancestral relations and relevant interventions for each hypothesis-specific primary variable, referring to as causal discovery. Towards this end, we propose a peeling algorithm to establish a hierarchy of primary variables as nodes, starting with leaf nodes at the hierarchy's bottom, for which we derive a difference-of-convex (DC) algorithm for nonconvex minimization. Moreover, we prove that the peeling algorithm yields consistent causal discovery, and the DC algorithm is a low-order polynomial algorithm capable of finding a global minimizer almost surely under the data generating distribution. Second, we propose a modified likelihood ratio test, eliminating nuisance parameters to increase power. To enhance finite-sample performance, we integrate the modified likelihood ratio test with a data perturbation scheme by accounting for the uncertainty of identifying ancestral relations and relevant interventions. Also, we show that the distribution of a data-perturbation test statistic converges to the target distribution in high dimensions. Numerical examples demonstrate the utility and effectiveness of the proposed methods, including an application to infer gene regulatory networks.
翻译:直接关系的推论, 包括一些未说明的干预措施, 也就是说, 每项干预措施的目标并不为人所知, 是重要而具有挑战性。 例如, 解开遗传变异基因遗传基因的监管作用, 比如单核酸多形态( SNP), 因为这些遗传变异遗传遗传遗传变异( 单核酸多形态( SNP) ) 的监管功能, 这可能是不具体的干预措施。 在本篇文章中, 我们测试与未说明的干预措施的假设性直接关系。 首先, 我们得出可以产生可识别模型的条件。 与传统的推论不同, 假设性分布测试要求确定每个特定假设主要变量的祖传关系和相关干预措施, 指因果关系的发现。 为达到这一目的, 我们建议一种剥离性算法, 将原始变异变的变量作为节点, 从等级底部的叶节点开始, 我们为此得出一个差异性x(DC) 算法, 以最小的导算法 来得出一致的因果发现, DC 算法是一种低级的多数值算法, 能够找到在数据发布数据时的最小最小最小最小化的最小化 。 第二, 我们建议用法 测试性比比 测试性比, 测试性 测试性 测试性比 测试性 测试性 测试性 测试性 测试性, 测试性 测试性 测试性 测试性 测试性 测试性 测试性 测试性, 测试性,, 测试性 测试性 测试性比 测试性 测试性,, 我们 测试性 测试性 测试性 测试性 测试性, 测试性 测试性 测试性, 测试性 测试性 测试性 测试性 测试性 测试性,, 测试性,, 性 性 性 性 性 性 性 性 性 性 性比性 性 性 性 性 测试性 测试性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 测试性 性 测试性 测试性 性 性 性 测试性 测试性 性 性 性