【博士论文】用于概率程序与生成模型的变分推断

黑箱随机变分方法（black-box stochastic variational methods）已成为近似推断的主要方法之一，并构成了结构化生成模型中摊销推断（amortized inference）的基础。特别具有结构性的模型之一是概率程序（probabilistic programs），它们能够建模包含层次结构与离散潜变量（如随机控制流决策）的复杂生成过程。对于此类模型，标准的变分推断方法往往难以获得理想结果，其原因并非变分族表达能力不足，而是优化过程中难以摆脱局部极小值（local minima）。当模型包含离散组件、外部仿真器调用，或前述的随机控制流时，附加的可微性约束将显著加剧这些挑战，因为这类结构通常使得模型部分潜变量相对于参数的梯度不可计算。因此，许多依赖梯度的优化策略（尤其是基于重参数化技巧 reparameterization 的方法）将不再适用，研究者不得不依赖效率较低、且方差可能极高的替代方法。在受限的采样预算条件下（例如计算代价昂贵的模型），这种问题会被进一步放大，因为无法通过增加采样数量来降低方差。本论文旨在提出并发展一系列新的思想与技术，以应对这些在结构化与离散潜变量模型中所面临的限制——这类挑战广泛存在于概率程序与生成建模领域，并且至今仍是现代变分推断研究中的重要难题。![]

成为VIP会员查看完整内容

相关内容

博士论文

关注 0

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【EPFL博士论文】因果推断的方法学进展：实验、识别与估计

专知会员服务

13+阅读 · 11月5日

【CMU博士论文】基于深度学习的高效贝叶斯实验设计

专知会员服务

16+阅读 · 8月19日

【博士论文】针对基于文本的基础模型的分类偏差分析与缓解

专知会员服务

15+阅读 · 3月10日

【CMU博士论文】可验证数学自动化的语言模型交互、集成与自动形式化

专知会员服务

20+阅读 · 2月14日