Suppose there are $N$ units and $D$ interventions. We aim to learn the average potential outcome associated with every unit-intervention pair, i.e., $N \times D$ causal parameters. While running $N \times D$ experiments is conceivable, it can be expensive or infeasible. This work introduces an experiment design, synthetic A/B testing, and the synthetic interventions (SI) estimator to recover all $N \times D$ causal parameters while observing each unit under at most two interventions, independent of $D$. Under a novel tensor factor model for potential outcomes across units, measurements, and interventions, we establish the identification of each parameter. Further, we show the SI estimator is finite-sample consistent and asymptotically normal. Collectively, these also lead to novel results for panel data settings, particularly for synthetic controls. We empirically validate our experiment design using real e-commerce data from a large-scale A/B test.
翻译:假设有单位单位为N美元,干预措施为$D美元。 我们的目标是了解每个单位- 干预对的人均潜在结果, 即, 美元/ 乘以D美元因果参数。 虽然运行 $/ 乘以D美元实验是可以想象的, 但它可能是昂贵的或不可行的。 这项工作引入了实验设计、 合成A/ B 测试和合成干预( SI) 估计器, 以回收所有美元/ 乘以D美元因果参数, 同时在最多两次干预中观察每个单位, 不受D美元影响的因果参数。 在针对各单位、 测量和干预的潜在结果的新颖的 " 点数 " 模型下, 我们确定每个参数的特性。 此外, 我们展示了SI 估计器是有限的、 一致的、 暂时的正常的。 总体而言, 这还导致小组数据设置的新结果, 特别是合成控制。 我们从经验上验证我们的实验设计, 使用大规模A/ B 测试中的真实的电子商务数据。