【MIT博士论文】机器学习应用中稀疏和低秩矩阵优化的进展

在运筹学、机器学习和统计学的众多基本问题中，自然地表现为稀疏性或秩约束的优化问题。稀疏解因其可解释性和存储效率而备受青睐。此外，在机器学习环境中，稀疏解通常展现出更好的模型泛化能力，并在高维数据集中自然地诠释为特征提取的过程。另一方面，由于矩阵的秩等价于其奇异值向量的基数，因此秩可以被理解为矩阵的稀疏性推广。相应地，低秩解继承了稀疏解的类似优点，同时具备更为灵活的建模能力。不幸的是，对基数和秩的优化是非凸且一般为NP难的，这使得我们在很大程度上依赖于凸松弛和启发式方法，但这些方法往往只能提供次优解。本论文推动了稀疏和低秩矩阵优化的理论和应用，重点关注统计学和机器学习中的问题。我们通过利用混合整数和混合投影优化的技术，开发了面向基数和秩约束问题的算法方法。所提出的算法优于现有的凸松弛和启发式方法。我们的严谨分析和实验证明旨在为优化的理论基础做出贡献，同时开发用于统计学和机器学习复杂挑战的实用工具。第二章研究了稀疏加低秩矩阵分解问题。我们提出了一种交替最小化算法，可计算高质量的可行解，性能超越基准方法，并可在几分钟内扩展到维度为n=10000n = 10000n=10000 的情况。此外，我们设计了一种定制的分支定界算法，可在几分钟内全局求解维度达n=25n = 25n=25 的问题实例。第三章探讨了压缩感知问题，我们提出了一种定制的分支定界算法，可以计算全局最优解。与最新的基准方法相比，我们的方法在合成数据上获得的解平均稀疏性提升6.22%，在真实的心电图（ECG）数据上稀疏性提升9.95%。此外，当用作多标签学习算法的一部分时，我们的方法在性能上也优于基准方法。第四章研究了学习一个能够预测完全观测的辅助信息的部分观测矩阵的问题，这扩展了矩阵补全问题的一个重要泛化。我们将该问题重新表述为一个混合投影优化问题，并提出了交替方向乘子法（ADMM）算法，能够在不到一分钟内解决行数为n=10000n = 10000n=10000、列数为m=10000m = 10000m=10000 的问题。在大规模真实数据上，我们的算法比基准方法的样本外误差低67%，执行时间减少97%。

成为VIP会员查看完整内容

相关内容

博士论文

关注 102

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【牛津大学博士论文】基于元学习和对称性的数据高效深度学习探索

专知会员服务

22+阅读 · 10月27日

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

专知会员服务

28+阅读 · 10月17日

【牛津博士论文】大规模观测因果机器学习中的结构与统计不确定性

专知会员服务

20+阅读 · 9月29日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

21+阅读 · 8月27日