分子可以采取多种构型,它们以随机的方式出现,并遵循所谓的玻尔兹曼分布。对这种分布进行建模和采样对于许多应用至关重要,例如理解生化过程和疾病机制,以及发现药物。传统的玻尔兹曼分布采样方法成本高昂,而通过机器学习模型对其进行近似则提供了一种替代方案,这些模型可以作为代理。正规化流(normalising flows)是一种常用于此任务的可处理密度模型。本论文旨在改进实施、采样和训练正规化流的方法,并增强其架构,重点应用于玻尔兹曼分布的模拟。首先,本文介绍了一个用于在Python中实现正规化流的软件包。该软件包涵盖了大多数常见的流架构,并提供了许多特别有助于模拟玻尔兹曼分布的工具,例如用于建模周期性坐标(如角度)的采样层和流模型。接下来,本文提出了一种用于采样方法Hamiltonian Monte Carlo(HMC)的超参数调优过程。该过程在变分目标上运行基于梯度的优化算法。Hamiltonian Monte Carlo可以应用于正规化流之上,以增强其样本质量。通过我们的方法获得改进的超参数后,我们能够更准确地近似分子丙氨酸二肽的玻尔兹曼分布。第三,通过引入一种新颖的基础分布,我们使正规化流变得更具表现力。该方法通过带有学习的接受函数的拒绝采样改变了基础分布的拓扑结构,从而克服了正规化流的架构缺陷,并在多样化的应用中获得了更好的性能。此外,为了应对大多数流训练方法对数据的依赖性(这些数据通常生成成本高),我们引入了一种仅需要目标非标准化密度的技术。在训练过程中,我们从流模型中采样,并通过退火重要性采样(annealed importance sampling)将样本逐步移动到目标分布。通过这种方法,我们可以估计质量覆盖目标,并提高采样效率。利用这种方法,我们首次在没有任何训练数据的情况下,仅使用目标密度成功学习了丙氨酸二肽的完整玻尔兹曼分布。最后,我们将大多数物理系统所具有的旋转和平移对称性引入到流模型中。我们是最早在笛卡尔坐标系下学习丙氨酸二肽的玻尔兹曼分布的研究者之一,并且我们的方法比现有的竞争方法显著更快。

成为VIP会员查看完整内容
24

相关内容

剑桥大学(英语:University of Cambridge;勋衔:Cantab)为一所座落于英国剑桥郡剑桥市的研究型大学。它是英语世界中历史第二悠久的大学,也是世界现存第四古老的大学。剑桥大学的起源为一群牛津大学的学者,因与牛津市民发生冲突而移居至剑桥。剑桥与牛津这两所在中世纪建立的英国大学,在校务运作、学术声望、社会地位等多方面都非常相似,经常合称为“牛剑”
【CMU博士论文】分布偏移下的不确定性量化,226页pdf
专知会员服务
29+阅读 · 2023年9月30日
【牛津大学博士论文】关系数据的学习和推理,243页pdf
专知会员服务
53+阅读 · 2022年11月16日
【MIT博士论文】数据高效强化学习,176页pdf
最新《图嵌入组合优化》综述论文,40页pdf
【KDD2020】图神经网络:基础与应用,322页ppt
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
155+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
397+阅读 · 2023年3月31日
Arxiv
19+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员