受益于大规模并行计算硬件的进步,训练于海量数据之上的机器学习模型已具备完成复杂任务的能力,例如生成逼真的图像或进行自然语言对话。然而,这些模型往往无法意识到自身的无知,从而导致过度自信和“幻觉”现象。

高斯过程是一种功能强大的不确定性感知函数逼近与序贯决策框架。然而,其经典形式在处理大规模数据以及适配现代并行计算硬件方面表现不佳,因此促使众多研究者致力于提升其可扩展性的技术研究。 本论文聚焦于迭代方法路径条件(pathwise conditioning)的强大组合,通过方法论上的贡献,推动高斯过程在现代大规模场景中的应用。通过协同结合这两类技术,昂贵的计算被转化为线性方程组的求解问题,并借助迭代线性求解器完成。这一策略显著降低了内存需求,使得高斯过程能够应用于更大规模的数据集,同时将矩阵乘法作为主要计算操作,极大地契合了现代硬件的计算优势。 具体而言,本论文引入了随机梯度算法作为一种高效的迭代线性系统求解方法。为此,论文设计并分析了定制的优化目标函数、随机梯度估计器以及方差降低技术。从实证角度看,所提出的方法在大规模回归、贝叶斯优化与分子结合亲和力预测任务中实现了最先进的性能表现。 此外,论文还提出了一系列通用改进方法,适用于高斯过程背景下任意迭代线性系统求解器,在计算效率方面相比既有方法可实现最高达 72 倍 的加速。进一步地,论文将迭代方法与路径条件结合结构化线性代数技术,以获得更高程度的可扩展性,并在包括机器人、自动化机器学习与气候建模在内的真实数据集上(样本数高达 五百万)验证了其效果。

成为VIP会员查看完整内容
12

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
论文浅尝 | 使用循环神经网络的联合事件抽取
开放知识图谱
25+阅读 · 2019年4月28日
CCCF专栏 | 面向领域定制的神经网络结构设计
中国计算机学会
10+阅读 · 2018年12月17日
论文浅尝 | 远程监督关系抽取的生成式对抗训练
开放知识图谱
17+阅读 · 2018年7月12日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
170+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
472+阅读 · 2023年3月31日
Arxiv
18+阅读 · 2021年3月16日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员