黑箱随机变分方法(black-box stochastic variational methods)已成为近似推断的主要方法之一,并构成了结构化生成模型中摊销推断(amortized inference)的基础。特别具有结构性的模型之一是概率程序(probabilistic programs),它们能够建模包含层次结构与离散潜变量(如随机控制流决策)的复杂生成过程。 对于此类模型,标准的变分推断方法往往难以获得理想结果,其原因并非变分族表达能力不足,而是优化过程中难以摆脱局部极小值(local minima)。当模型包含离散组件、外部仿真器调用,或前述的随机控制流时,附加的可微性约束将显著加剧这些挑战,因为这类结构通常使得模型部分潜变量相对于参数的梯度不可计算。 因此,许多依赖梯度的优化策略(尤其是基于重参数化技巧 reparameterization 的方法)将不再适用,研究者不得不依赖效率较低、且方差可能极高的替代方法。在受限的采样预算条件下(例如计算代价昂贵的模型),这种问题会被进一步放大,因为无法通过增加采样数量来降低方差。 本论文旨在提出并发展一系列新的思想与技术,以应对这些在结构化与离散潜变量模型中所面临的限制——这类挑战广泛存在于概率程序与生成建模领域,并且至今仍是现代变分推断研究中的重要难题。![]

成为VIP会员查看完整内容
0

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【CMU博士论文】面向目标的自主智能体推理
专知会员服务
24+阅读 · 9月11日
【博士论文】强化学习智能体的奖励函数设计
专知会员服务
48+阅读 · 4月8日
【MIT博士论文】数据高效强化学习,176页pdf
最新《图嵌入组合优化》综述论文,40页pdf
最新《动态网络嵌入》综述论文,25页pdf
专知
37+阅读 · 2020年6月17日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
484+阅读 · 2023年3月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员