随着近年来可用数据量的急剧增长,无论是在样本数量(大 nnn)还是预测变量数量(大 ppp)方面,开发适用于大规模统计方法的方法论与理论理解已成为一个紧迫课题。虽然“大样本”主要带来了计算层面的问题,但“高维预测变量”则引出了特定的统计问题,即所谓的“维度灾难”。在本论文中,我们研究了流形假设——即高维预测变量往往蕴含未知的低维结构——如何在此背景下提升贝叶斯非参数估计方法的统计收敛性。

在本论文的引言部分,我们将介绍后续章节中用于解决上述问题的数学工具。我们首先在第 1.1 节回顾微分几何与黎曼几何中的基本概念,重点关注欧几里得空间中的子流形结构。接着在第 1.2 节中,我们介绍紧子流形与有限图的谱理论基础,并展示随机图如何对未知子流形进行有效逼近。在第 1.3 节,我们介绍贝叶斯非参数统计中用于推导后验收缩率的关键证明技巧。最后,第 1.4 节将综述与第 2、3 和 4 章所研究问题相关的非参数估计理论的当前研究进展。

作为一篇综合性博士论文,第 2、3 和 4 章分别包含已发表或已提交待审的研究论文。在第 2 与第 3 章中,我们研究协变量支持在未知子流形上的非参数回归问题。我们针对一类此前研究较少的方法,推导出仅依赖于数据内在维度的后验收缩率。在第 4 章中,我们将重点研究概率分布支持在未知子流形附近的密度估计问题,设计一类新的非参数高斯混合模型,并推导其对应的后验收缩率,同时也介绍该方法的实现细节。 最后,第 5 章对全文进行总结与讨论。

成为VIP会员查看完整内容
0

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【CMU博士论文】最优传输的统计推断
专知会员服务
26+阅读 · 2024年5月29日
数据受限条件下的多模态处理技术综述
专知
19+阅读 · 2022年7月16日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
最新《图嵌入组合优化》综述论文,40页pdf
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
168+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
453+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
24+阅读 · 2023年3月17日
Arxiv
18+阅读 · 2021年3月16日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员