【剑桥大学博士论文】可识别的因果表示学习：无监督、多视角、多环境，192页pdf

本论文将因果关系和表示学习的思想结合起来。因果模型以一组机制的形式提供复杂系统的丰富描述，每个变量都受其直接原因的影响。它们支持对系统部分进行操纵的推理，捕获一整套干预分布，因此有望解决人工智能（AI）的一些开放性挑战，如规划、在变化环境中转移知识或对分布变化的鲁棒性。然而，因果模型在AI中更广泛使用的一个主要障碍是需要预先指定相关变量，这通常不适用于现代AI系统处理的高维、非结构化数据。与此同时，机器学习（ML）在自动提取此类复杂数据的有用且紧凑的表示方面已经证明相当成功。因果表示学习（CRL）旨在通过学习以因果模型语义赋予的潜变量形式的表示来结合ML和因果关系的核心优势。在这篇论文中，我们研究并呈现了不同CRL设置的新结果。一个核心主题是可识别性的问题：给定无限数据，何时满足相同学习目标的表示保证是等价的？这可以说是CRL的一个重要先决条件，因为它正式表明学习任务在原则上至少是可行的。由于学习因果模型——即使没有表示学习组件——是出了名的困难，我们需要对模型类或超出经典i.i.d.设置的丰富数据进行额外假设。对于从i.i.d.数据进行的无监督表示学习，我们开发了独立机制分析，这是对将潜变量映射到观察变量的混合函数的约束，它被证明促进了独立潜变量的可识别性。对于从非独立观察对学习的多视角设置，我们证明了在视图中始终共享的潜在块是可识别的。最后，对于从完美单节点干预产生的非同分布数据集学习的多环境设置，我们显示了潜变量及其因果图是可识别的。通过研究和部分描述不同设置的可识别性，这篇论文调查了在没有直接监督的情况下CRL的可能性和不可能性，因此为其理论基础做出了贡献。理想情况下，开发的见解可以帮助指导数据收集实践或激发新的实用估计方法和算法的设计。

成为VIP会员查看完整内容

相关内容

博士论文

关注 118

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【斯坦福博士论文】使用等变神经网络高效学习三维分子结构，154页pdf

专知会员服务

19+阅读 · 2024年2月14日

【牛津大学博士论文】理解深度强化学习的表示学习，228页pdf

专知会员服务

59+阅读 · 2024年1月6日

【MIT博士论文】建模神经网络表示空间的几何结构，365页pdf

专知会员服务

55+阅读 · 2023年11月11日

【普林斯顿博士论文】可扩展和可解释的学习：用于知识发现的概率模型， 140页pdf

专知会员服务

55+阅读 · 2023年10月10日