深度概率模型在高维、多模态数据合成和密度估计任务中已成为最新的技术前沿。通过将抽象的概率公式与神经网络的表达能力和可扩展性相结合,深度概率模型已成为机器学习工具箱中的基本组成部分。然而,这些模型仍然存在一些局限性。例如,深度概率模型通常局限于基于梯度的训练,因此难以结合非可微操作;它们的训练和采样成本较高;并且深度概率模型往往没有利用先验的几何和特定问题的结构知识。 本论文由四部分研究工作组成,通过基于最优传输的仿真方法推动深度概率模型领域的发展。首先,使用Sinkhorn算法的正则化最优传输,我们提供了一个理论上有依据且可微的粒子滤波中重新采样的近似方法。这使得人们能够通过端到端可微粒子滤波对状态空间模型(一类序列概率模型)进行基于梯度的训练。接下来,我们探讨了Sinkhorn算法的初始化策略以解决速度问题。我们展示了精心的初始化可以显著加速Sinkhorn算法。这在可微排序、变分自编码器潜在空间中的聚类以及粒子滤波中都有应用。 剩下的两项工作通过薛定谔桥对基于扩散的生成模型领域作出了贡献。首先,我们将扩散模型与薛定谔桥联系起来,称之为扩散薛定谔桥。这一方法论实现了加速采样、数据到数据的仿真以及一种计算高维连续状态空间问题的正则化最优传输的新方法。最后,我们将扩散薛定谔桥扩展到黎曼流形设置。这使得人们能够结合先验的几何知识,从而实现对黎曼流形值数据的扩散模型的更高效的训练和推理。这在气候和地球科学中有应用。 观察到的现象通常具有高维度、分布上多模态,并且来自于尚未完全理解的随机复杂系统。科学家的职责是更好地理解我们周围物理和社会世界中的这些观察现象。对统计机器学习研究人员特别感兴趣的是开发数据驱动的模型来模拟和预测感兴趣的随机量及其相互作用。此类数据驱动的机器学习方法通常包括利用大型数据集和富有表现力的模型参数化来弥合领域知识与经验证据之间的差距。 随着技术的进步,我们现在能够捕获、存储和访问大量且不断增加的数据。结合现代计算资源,广大数据可用于从业者训练大型且灵活的神经网络参数化模型。富有表现力的神经网络与理论上有依据的统计方法之间的协同作用,提供了一种原则性的、可扩展的方式来准确表示感兴趣的随机量之间复杂关系。深度概率模型正位于此交汇点,并已成功应用于多个领域,包括:视觉和语言的经典机器学习任务;时间序列、预测或密度估计的统计推断问题;以及自然科学应用。尽管进展迅速,但仍有许多未解决的挑战。深度概率模型在训练和部署方面都资源昂贵。如何高效地训练和模拟概率模型尚不明确,尤其是对于迭代扩散模型。也不总是清楚如何将现有的特定问题知识或结构融入深度概率模型中。从直观和实验上来看,结合现有知识可以开发出更有效的损失目标和更高效的模型,从而减少学习高性能模型所需的数据量和参数量。最终,结合领域知识可以减少神经网络需要通过从数据中学习来弥合的差距。在将涉及非可微操作(如排序、聚类或重采样)的理论上有依据的统计方法与通常限于基于梯度训练的深度网络的表现力相结合方面,也存在许多挑战。 本论文通过引入基于最优传输和仿真方法的新方法,对深度概率模型的发展作出了贡献。 贡献
本文包括多项研究成果,可大致分为两个部分。论文的前半部分使用离散的熵正则化最优传输(OT)推导出新颖且改进的深度概率模型训练方案。论文的后半部分探索了熵正则化最优传输在连续状态空间和扩散模型中的新方法,通过扩散Schrödinger桥和黎曼扩展来实现。 仿真方法。仿真是一个广泛使用的术语,通常与蒙特卡罗(Monte Carlo)互换使用。在本研究中,仿真是指对随机过程的评估,包括:蒙特卡罗积分、马尔可夫链蒙特卡罗、概率模型以及简单的随机变量实现。本文中仿真将用于两个上下文。首先,仿真在蒙特卡罗积分的意义上使用,指的是近似那些通常表现为不可解积分的损失。其次,运行概率模型的生成过程也称为仿真。在某些方法中,从概率模型进行仿真直接用于近似训练损失,例如GANs。然而,其他可扩展方法如扩散模型在训练和部署期间有不同的仿真过程。 可微分粒子滤波。本文的第一篇文章【19】详细介绍于第三章,考虑利用Sinkhorn算法实现端到端可微分粒子滤波。这允许训练神经网络参数化的状态空间模型,从而以原则性的方式利用问题的序列结构以及神经网络的表达能力。粒子滤波是一类蒙特卡罗方法,用于在状态空间模型中执行状态推断和似然估计【30】。给定按时间t ∈ {1, . . . , T}索引的顺序未观察到的潜在状态(Xt)t和观测值(Yt)t,状态空间模型是一个顺序概率模型,其特征在于潜在状态的转移模型,表示为密度fθ(xt|xt−1),以及观测模型gθ(yt|xt)。这在包括机器人技术、计量经济学和流行病学在内的科学领域中有应用【18, 29, 31, 33】。粒子滤波提供了观测值的渐近无偏对数似然估计log p(y1:T),可用于以原则性的方式学习转移和观测模型的参数。 粒子滤波包括三个主要操作的顺序应用:
牛津大学是一所英国研究型大学,也是罗素大学集团、英国“G5超级精英大学”,欧洲顶尖大学科英布拉集团、欧洲研究型大学联盟的核心成员。牛津大学培养了众多社会名人,包括了27位英国首相、60位诺贝尔奖得主以及数十位世界各国的皇室成员和政治领袖。2016年9月,泰晤士高等教育发布了2016-2017年度世界大学排名,其中牛津大学排名第一。