在领域泛化工作中,一个常见的目标是在类标签条件下学习独立于领域的表示。我们证明这个目标是不充分的: 存在反例,在满足类条件域不变性后,模型不能泛化到不可见域。我们通过一个结构性因果模型将这个观察形式化,并展示了类内变量建模对泛化的重要性。具体来说,类包含描述特定因果特征的对象,而域可以被解释为对这些对象的干预,这些对象改变了非因果特征。我们强调了一个可选条件:如果来自相同对象,那么跨域的输入应该具有相同的表示。在此基础上,我们提出了观测基础目标时的匹配算法(如通过数据增强)和未观测目标时的近似算法(MatchDG)。我们简单的基于匹配的算法在旋转MNIST、Fashion-MNIST、PACS和胸部x射线数据集的域外精度方面具有很好性能。我们的方法MatchDG也恢复了真实对象匹配:在MNIST和Fashion-MNIST上,MatchDG的前10个匹配与真实匹配有超过50%的重叠。
https://www.zhuanzhi.ai/paper/31ab67a1084ea226ed432d5f8240cffb