In this article, variational state estimation is examined from the dynamic programming perspective. This leads to two different value functional recursions depending on whether backward or forward dynamic programming is employed. The result is a theory of variational state estimation that corresponds to the classical theory of Bayesian state estimation. More specifically, in the backward method, the value functional corresponds to a likelihood that is upper bounded by the state likelihood from the Bayesian backward recursion. In the forward method, the value functional corresponds to an unnormalized density that is upper bounded by the unnormalized filtering density. Both methods can be combined to arrive at a variational two-filter formula. Additionally, it is noted that optimal variational filtering is generally of quadratic time-complexity in the sequence length. This motivates the notion of sub-optimal variational filtering, which also lower bounds the evidence but is of linear time-complexity. Another problem is the fact that the value functional recursions are generally intractable. This is briefly discussed and a simple approximation is suggested that retrieves the filter proposed by Courts et. al (2021).The methodology is examined in (i) a jump Gauss-Markov system under a certain factored Markov process approximation, and (ii) in a Gauss-Markov model with log-polynomial likelihoods under a Gauss--Markov constraint on the variational approximation. It is demonstrated that the value functional recursions are tractable in both cases. The resulting estimators are examined in simulation studies and are found to be of adequate quality in comparison to sensible baselines.


翻译:本文从动态规划的视角探讨变分状态估计问题。根据采用后向或前向动态规划的不同,导出了两种不同的价值函数递归形式。该理论构成了与经典贝叶斯状态估计理论相对应的变分状态估计框架。具体而言,在后向方法中,价值函数对应于一种似然函数,其上界由贝叶斯后向递归的状态似然给出;在前向方法中,价值函数对应于非归一化密度,其上界由非归一化滤波密度界定。两种方法可结合推导出变分双滤波公式。此外,研究指出最优变分滤波的时间复杂度通常为序列长度的二次方,这引出了次优变分滤波的概念——其在保持证据下界性质的同时将复杂度降至线性。另一个挑战在于价值函数递归通常难以直接求解,本文对此进行了简要讨论,并提出一种可还原Courts等人(2021)所提滤波器的简易近似方法。该理论方法在以下两类模型中进行了验证:(i)采用特定分解马尔可夫过程近似的跳跃高斯-马尔可夫系统;(ii)具有对数多项式似然的高斯-马尔可夫模型,并对其变分近似施加高斯-马尔可夫约束。研究表明这两种情形下价值函数递归均可解析求解。通过仿真实验对所得估计器进行评估,发现其相较于合理基线方法具有足够的估计质量。

0
下载
关闭预览

相关内容

【ICML2023】SEGA:结构熵引导的图对比学习锚视图
专知会员服务
22+阅读 · 2023年5月10日
专知会员服务
19+阅读 · 2021年8月15日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
论文浅尝 | Interaction Embeddings for Prediction and Explanation
开放知识图谱
11+阅读 · 2019年2月1日
误差反向传播——CNN
统计学习与视觉计算组
30+阅读 · 2018年7月12日
论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG
开放知识图谱
36+阅读 · 2018年3月30日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关资讯
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
论文浅尝 | Interaction Embeddings for Prediction and Explanation
开放知识图谱
11+阅读 · 2019年2月1日
误差反向传播——CNN
统计学习与视觉计算组
30+阅读 · 2018年7月12日
论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG
开放知识图谱
36+阅读 · 2018年3月30日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员