本论文探讨了如何使用机器学习从高维无结构数据中学习因果结构、机制和表示,重点关注视觉和时间系统。首先,论文介绍了ENCO,一种用于神经因果发现的新算法,能够处理干预数据。ENCO将图搜索重新定义为独立边缘似然的优化,保证了收敛性,并能够高效地扩展到大规模图,同时处理确定性变量和潜在混杂变量。接下来,论文着重于因果表示学习,提出了CITRIS,一种基于神经网络的方法,可以从带有干预的高维时间序列数据中识别标量和多维因果因素。这包括建立因果表示学习与干预设计之间的联系,确定识别所需的最小干预。该方法进一步扩展为处理瞬时效应,推出iCITRIS,能够同时识别因果变量并学习它们的瞬时因果图。随后,论文探讨了基于代理的框架,提出了BISCUIT,一种变分自编码器,通过无监督学习在复杂环境中识别因果变量和代理交互,展示了其在具身AI和机器人学中的应用。最后,论文研究了由偏微分方程(PDE)描述的动态系统。通过分析神经PDE求解器的时间展开策略,发现对非主导空间频率的不准确建模是一个关键问题,并且因果地影响长期动态。为了解决这个问题,提出了PDE-Refiner,一种受扩散启发的方法,用于细化所有频率分量的建模。因果推理的能力在我们的日常生活中扮演着至关重要的角色。无论我们想知道今天早晨闹钟为什么没有响,为什么我们的自行车坏了,还是为什么天空是蓝色的,我们都在不断寻找因果解释。对“为什么”这一问题的追寻自古以来就被认为是人类知识的核心。早在亚里士多德时,这位希腊哲学家就曾断言:“我们对某事物的知识,只有在掌握了它的‘为什么’,即它的因果关系后,才算真正拥有”(Charlton,1983)。几个世纪后,哲学家约翰·斯图尔特·密尔(John Stuart Mill)指出,我们对世界的理解是建立在识别因果关系的基础上的(Mill,1843)。因果推理的重要性不仅仅体现在理解方面,它还使我们能够预测并可能控制未来事件。在我们的日常生活中,这可能表现为防止事故发生和解决技术问题。在科学研究中,它使我们能够应对复杂的科学挑战,例如理解气候变化背后错综复杂的因果关系,从而减缓其影响。正如朱迪亚·皮尔(Judea Pearl)简洁地指出的:“因果关系是物理现实以及人类对现实理解的基本构建块”(Pearl,2009)。尽管人类被认为能够对抽象概念(如物体及其相互作用)进行因果推理,但我们并非天生以这种结构化的因果形式感知环境。相反,我们通过感官器官——主要是我们的眼睛、耳朵和触觉——来体验世界,这些感官为我们提供复杂的高维输入数据。例如,我们的视觉皮层接收着持续不断的光子流,这些光子流必须经过处理和解释,才能形成连贯的知觉。从婴儿期开始,人类就学习如何解读和理解这种复杂的感官输入,逐步构建出对物理世界的因果描述。发展心理学家已证明,即使是非常年轻的儿童也能推断因果关系,并形成对物理学的朴素理解(Buchsbaum等,2012;Goddu和Gopnik,2024;Gopnik和Schulz,2007)。从原始感官数据构建因果模型的过程,不仅对我们日常的互动至关重要,而且为我们推理更复杂现象的能力奠定了基础。尽管人类通过感官输入发展因果理解,现代人工智能系统则以不同的方式处理类似的挑战。这些AI模型处理图像、视频和语音等原始数据,在各种任务中取得了令人印象深刻的成果,往往达到了或超过了人类的表现。然而,它们也在面对看似简单的情境时表现出令人惊讶的失败,特别是在输入数据受到轻微扰动时。这种差异源于方法的根本不同:大多数AI系统依赖于模式匹配和统计相关性,将输入映射到输出,而不是构建世界的因果模型。从观测数据集中唯一地识别因果关系是一个非常具有挑战性的任务,并且在没有额外假设的情况下,通常是不可能的(Spirtes等,2000)。这一局限性导致了AI中的一个关键问题:难以区分相关性与因果关系。这种混淆导致了许多数据的误解或荒谬的假设,例如吃巧克力导致诺贝尔奖或鹳鸟带来婴儿的说法(Aggarwal & Ranganathan,2016;Messerli,2012;Vigen,2024)。随着有关人类水平AI表现的讨论日益增多,像朱迪亚·皮尔(Judea Pearl)和约书亚·本吉奥(Yoshua Bengio)这样的研究人员认为,实现真正的人类水平智能需要在AI系统中开发因果推理能力(Bengio,2019;Pearl,2018)。构建和推理因果模型的能力,而不仅仅是识别统计模式,被视为创建能够真正理解和与世界互动的类人AI的重要一步。本论文旨在弥合这一差距,研究如何从高维无结构数据中学习因果结构、机制和表示,特别聚焦于视觉输入,如图像和视频序列。通过集中研究具有时间和空间特征的环境,我们反映了人类因果理解在物理世界中的复杂性。为了为我们的工作提供全面的背景,本章其余部分结构如下:第1.1节介绍了基于相关性的学习在机器学习中的缺陷,强调了因果方法的必要性。第1.2节讨论了因果关系的基本概念,为我们的研究奠定理论框架。第1.3节详细探讨了因果表示学习的任务,探索了其挑战和潜力。然后,在第1.4节中,我们提出了具体的研究问题,概述了本论文旨在解决的关键问题。最后,在第1.5节中,我们列出了我们的出版物和各章节的个人贡献。

成为VIP会员查看完整内容
0

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【ETHZ博士论文】金融网络与图学习的其他探索
专知会员服务
18+阅读 · 1月22日
【博士论文】学习对象和关系的结构化表示
专知会员服务
29+阅读 · 2024年10月14日
【MIT博士论文】物理启发的生成式模型
专知会员服务
31+阅读 · 2024年9月6日
【MIT博士论文】理解与提升机器学习模型的表征鲁棒性
专知会员服务
26+阅读 · 2024年8月26日
【MIT博士论文】非参数因果推理的算法方法,424页pdf
专知会员服务
83+阅读 · 2022年9月20日
深度多模态表示学习综述论文,22页pdf
专知
31+阅读 · 2020年6月21日
论文浅尝 | 采用多层注意力机制的事件检测
开放知识图谱
23+阅读 · 2019年8月24日
PointNet系列论文解读
人工智能前沿讲习班
17+阅读 · 2019年5月3日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
433+阅读 · 2023年3月31日
Arxiv
73+阅读 · 2023年3月26日
Arxiv
157+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
微信扫码咨询专知VIP会员