在许多问题上,模型误设定构成了可靠推理的主要障碍。在贝叶斯设置中,模型误设定会导致不一致,以及对数量相关的后验分布的过度自信,即对不确定性的漏报。
本论文开发了一个贝叶斯框架,以减少在涉及时间序列数据的推理问题中出现的一种模型误设定的影响:观察和建模数据之间未建模的时间扭曲。涉及动态系统、信号处理和更普遍的功能数据的推理问题都会受到这种错误设定的影响。地震学中的逆向问题是这类问题的一个重要例子:在描述复杂的、空间异质的地震波传播速度方面的不准确,会导致其建模的时间演化的错误。数据不足以约束这些传播速度,因此我们寻求对模型误差的鲁棒性。我们的方法是使用传输-拉格朗日(TL)距离作为损失/失误函数:这种距离可以被理解为 "图空间 "的最优传输距离,它们自然忽略了数据中对时间扭曲更敏感的某些特征。我们表明,与标准的失配函数相比,它们产生的后验分布既不偏颇又不分散。
特别是,我们使用矩张量反演,一个地震反演问题,作为我们的主要激励性应用,并通过各种统计和物理指标证明TL损失的反演性能得到改善,适用于一系列日益复杂的反演和错误规范的情况。同时,我们还解决了几个更广泛的方法学问题。首先,在缺乏基于TL的可能性的可操作性表达的情况下,我们使用吉布斯后验的概念构建了一个一致的先验-后验升级版。然后,我们通过几个统计评分规则和等级统计,以及特定应用的物理标准,更广泛地探索什么是在错误设定的环境中构成 "好的"推理,来比较不同损失函数对吉布斯后验的影响。为了将我们的广义(吉布斯)贝叶斯方法与更传统的贝叶斯设置联系起来,我们还对随机噪声信号之间的传输-拉格朗日距离的统计特性进行了分析和数字调查。
作为对贝叶斯反演的补充,我们还证明了最优传输距离对频繁回归的效用。我们研究了带有TL损失的线性回归模型,描述了相关混合整数优化问题的几何结构,并提出了利用其基本结构的专用算法。然后,我们将TL线性回归与经典的线性回归在几个应用中进行了比较。
最后,我们讨论了TL距离的潜在概括,以包括通过时间序列嵌入的 "形状 "概念,以及所提出的框架对其他形式的模型错误规范的可能扩展。