潜在变量模型假设某些潜在变量在观测数据中缺失,这种模型已经被长期研究,并在实践中找到了众多应用。使用潜在变量的机器学习不仅可以提高预测的准确性,而且在增强数据的可解释性以及发现数据背后的原理上起到了关键作用。本论文致力于为各种潜在变量模型的学习开发高效和可证明的算法。第一和第二个主题涉及使用无标签样本学习混合模型,这是一种对异质和复杂数据进行建模的强大技术。考虑了两种具体设置:(1) 低秩模型的混合,将低复杂性的结构先验整合到高维的混合线性回归中;(2) 线性动态系统的混合,由于时间序列数据之间的时间依赖性,模型估计尤为具有挑战性。对于这两个问题,我们设计了有原则的和模块化的算法,并正式导出了可靠模型估计所需的样本复杂度。此外,实证证据证实,我们的方法有潜力推广到更广泛的设置,超出我们的理论研究所涵盖的范围。第三个主题涉及根据边缘上的成对比较对一组项目进行排名,这些项目构成了一个连接图。我们关注经典的Bradley-Terry-Luce模型,该模型假设成对比较的噪声测量是基于项目的某些未知潜在分数生成的。在关注潜在得分估计的前提下,我们首先导出了在一般图形拓扑下最大似然估计的接近最优的逐项错误,这是通过观察统计估计和迭代优化算法之间的关联来证明的。此外,我们开始研究具有局部性的图形中的排名,这在实践中由于物理约束而出现;我们的贡献包括(1)确定局部性不受影响的条件,以及(2)设计新颖的分而治之算法,即使在最小的样本复杂度下也能保证达到接近最优的错误,同时享有某些计算优势。

成为VIP会员查看完整内容
37

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【MIT博士论文】多模态:模型、算法与应用,196页pdf
专知会员服务
113+阅读 · 2023年8月17日
【斯坦福博士论文】元强化学习:算法与应用,149页pdf
专知会员服务
48+阅读 · 2023年7月11日
【伯克利博士论文】可信赖机器学习,227页pdf
专知会员服务
87+阅读 · 2022年12月12日
【MIT博士论文】异构医疗数据表示学习,193页pdf
专知会员服务
56+阅读 · 2022年9月3日
专知会员服务
34+阅读 · 2021年7月19日
深度多模态表示学习综述论文,22页pdf
专知
30+阅读 · 2020年6月21日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
Arxiv
155+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
395+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
137+阅读 · 2023年3月24日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员