解纠缠方法的重点一直是识别数据中的独立变异因素。然而,真实世界观察的因果变量在统计上往往不是独立的。在这项工作中,我们通过分析大规模实证研究(包括4260个模型)中对相关数据最突出的解纠缠方法的行为,弥合了与现实场景的差距。我们展示并量化了从数据集中系统导出的相关性被学习并反映在潜在表示中,这对解纠缠的下游应用(如公平)有影响。我们还演示了如何解决这些潜在的相关性,要么在训练期间使用弱监督,要么通过事后纠正带有少量标签的预训练模型。
https://www.zhuanzhi.ai/paper/4c164ade5a0d379632739e73d99900b2