【MIT博士论文】优化理论与机器学习实践

机器学习是一种从数据中提取预测模型，从而能够将预测泛化到未观察数据的技术。根据已知数据集选择良好模型的过程需要进行优化。具体地说，优化过程在约束集中生成一个变量来最小化目标。这个过程包含了包括神经网络训练在内的许多机器学习管道，这将是我们在本文中进行理论分析的主要试验场。在各种优化算法中，梯度方法因其高维可扩展性和反向传播的自然局限性而成为深度学习中的主导算法。然而，尽管基于梯度的算法很受欢迎，但我们从理论的角度对机器学习环境中的这种算法的理解似乎还远远不够。一方面，在现有的理论框架内，大多数上下界是封闭的，理论问题似乎得到了解决。另一方面，理论分析很难产生比实践者发现的经验更快的算法。本文回顾了梯度法的理论分析，指出了理论与实践的差异。然后，我们解释了为什么会发生不匹配，并通过发展由经验观察驱动的理论分析，提出了一些初始解决方案。

https://dspace.mit.edu/handle/1721.1/143318

成为VIP会员查看完整内容

相关内容

博士论文

关注 126

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【MIT博士论文】通过最优传输不匹配措施的鲁棒贝叶斯推断:应用和算法

专知会员服务

24+阅读 · 2022年7月14日

【MIT博士论文】机器学习与因果关系:建立高效、可靠的决策模型

专知会员服务

112+阅读 · 2022年7月10日

【CMU博士论文】现代深度学习的均衡(Equilibrium)方法，155页pdf

专知会员服务

37+阅读 · 2022年6月16日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知会员服务

61+阅读 · 2022年4月3日