本论文将因果关系与表示学习的思想结合在一起。因果模型通过描述每个变量受其直接原因影响的机制,提供了对复杂系统的丰富描述。因果模型支持对系统部分进行操作的推理,捕捉各种干预分布,从而有望解决人工智能(AI)的一些开放性挑战,如规划、在变化环境中的知识迁移或对分布变化的鲁棒性。然而,因果模型在AI中更广泛应用的一个关键障碍是需要预先指定相关变量,而这通常不适用于现代AI系统处理的高维、非结构化数据。同时,机器学习(ML)在自动提取此类复杂数据的有用和紧凑表示方面非常成功。因果表示学习(CRL)旨在通过学习具有因果模型语义的潜变量表示,结合ML和因果关系的核心优势。在本论文中,我们研究并提出了不同CRL设置的新结果。一个核心主题是可识别性的问题:给定无限数据,何时保证满足相同学习目标的表示是等价的?这可以说是CRL的重要先决条件,因为它正式表明了一个学习任务在原则上是否可行。由于学习因果模型——即使没有表示学习成分——是出了名的困难,我们需要在模型类或丰富数据上超越经典的独立同分布(i.i.d.)设置进行额外的假设。对于从i.i.d.数据中进行无监督表示学习,我们开发了独立机制分析,这是一种对映射潜在变量到观察变量的混合函数的约束,已证明可以促进独立潜在变量的可识别性。对于从非独立观测对中学习的多视图设置,我们证明了始终在视图间共享的不变潜在块是可识别的。最后,对于从单节点完美干预产生的非同分布数据集中学习的多环境设置,我们表明潜在变量及其因果图是可识别的。通过研究和部分描述不同设置下的可识别性,本论文探讨了在没有直接监督的情况下,CRL的可能性和不可能性,从而为其理论基础做出贡献。理想情况下,所发展的见解可以帮助指导数据收集实践,或激发新实用估计方法和算法的设计。

成为VIP会员查看完整内容
30

相关内容

剑桥大学(英语:University of Cambridge;勋衔:Cantab)为一所座落于英国剑桥郡剑桥市的研究型大学。它是英语世界中历史第二悠久的大学,也是世界现存第四古老的大学。剑桥大学的起源为一群牛津大学的学者,因与牛津市民发生冲突而移居至剑桥。剑桥与牛津这两所在中世纪建立的英国大学,在校务运作、学术声望、社会地位等多方面都非常相似,经常合称为“牛剑”
【牛津大学博士论文】抗规避攻击鲁棒学习的样本复杂度
【伯克利博士论文】学习跨领域的可迁移表示
专知会员服务
46+阅读 · 2022年8月17日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
论文浅尝 | 远程监督关系抽取的生成式对抗训练
开放知识图谱
17+阅读 · 2018年7月12日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
13+阅读 · 2008年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
156+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
139+阅读 · 2023年3月24日
Arxiv
20+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
13+阅读 · 2008年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员