深度学习在过去十年里引发了革命性变化,它在计算机视觉、自然语言处理和强化学习等众多任务中取得了非凡的进展,仅举几例。然而,众所周知,通过最大似然估计训练的深度模型往往过于自信,并给出校准不良的预测。贝叶斯深度学习试图通过对模型参数设置先验来解决这个问题,这些先验然后与似然结合以进行后验推断。不幸的是,对于深度模型,真实的后验是不可解的,迫使用户不得不使用近似方法。 在这篇论文中,我们探索了使用变分推断作为一种近似方法,因为它在同时近似后验和提供边缘似然的下界方面是独一无二的。如果这个下界足够紧,它可以用来优化超参数并促进模型选择。然而,这种能力很少在贝叶斯神经网络中充分利用,可能是因为实践中通常使用的近似后验缺乏有效约束边缘似然的灵活性。因此,我们探讨了三个方面的贝叶斯学习用于深度模型。首先,我们的调查从询问是否有必要对尽可能多的参数进行推断开始,或者是否可以将许多参数视为我们针对边缘似然进行优化的超参数。这会带来显著的计算节省;然而,我们观察到这可能导致病态行为和严重的过拟合,表明最好尽可能“完全贝叶斯”。接着,我们通过提出一种变分后验,为贝叶斯神经网络和深度高斯过程中的推断提供了一个统一的视角,我们展示了这种方法足够灵活,可以利用增加的先验超参数。最后,我们展示了如何通过从后验中解析地移除对称性,并在Gram矩阵而不是特征上进行推断,来改进某些深度高斯过程模型中的变分推断。虽然我们没有直接调查我们的改进对模型选择的应用,但我们希望我们的贡献能为未来充分实现变分推断的承诺提供一个基石。

成为VIP会员查看完整内容
33

相关内容

剑桥大学(英语:University of Cambridge;勋衔:Cantab)为一所座落于英国剑桥郡剑桥市的研究型大学。它是英语世界中历史第二悠久的大学,也是世界现存第四古老的大学。剑桥大学的起源为一群牛津大学的学者,因与牛津市民发生冲突而移居至剑桥。剑桥与牛津这两所在中世纪建立的英国大学,在校务运作、学术声望、社会地位等多方面都非常相似,经常合称为“牛剑”
【剑桥大学博士论文】机器学习中的分布外泛化,214页pdf
【牛津大学博士论文】持续学习的高效机器学习,213页pdf
专知会员服务
77+阅读 · 2022年10月19日
【牛津大学博士论文】深度迁移学习贝叶斯推断,157页pdf
【ETH博士论文】贝叶斯深度学习,241页pdf
专知会员服务
121+阅读 · 2022年1月16日
深度多模态表示学习综述论文,22页pdf
专知
28+阅读 · 2020年6月21日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
131+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
326+阅读 · 2023年3月31日
Arxiv
54+阅读 · 2023年3月26日
Arxiv
111+阅读 · 2023年3月24日
Arxiv
15+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员