优化算法是机器学习和统计推断的基石。随着大规模数据集的出现,计算挑战日益增加,迫使人们追求更高效的算法。现代优化技术通常针对特定的机器学习问题进行定制,这些方法利用问题的独特结构特征,使其比当前应用于这些问题的方法效率更高。另一个关键方面是理解所得到估计量的估计精度。在某些情况下,尽管在训练集上实现精确优化可能不切实际,但某些简单而有效的启发式方法在适当的统计框架内可以表现出令人赞叹的估计精度。 在本文中,我们从优化和统计的角度研究了几种大规模算法。第2章和第3章研究了两种针对结构约束的连续优化算法。第2章集中讨论了具有圆柱形约束的无界约束的一种广义Frank-Wolfe方法。第3章则研究了具有少量极点的多面体约束的类似坐标下降(CD)方法。这两种方法由于对问题结构的敏感性而表现出最先进的性能。 第4章研究了一种带有解释器-响应对之间可能存在不匹配的线性回归变体。我们研究了一种简单且高效的启发式方法,并在统计环境中对其估计误差进行了严格分析。 第5章和第6章研究了两种决策树算法。第5章研究了最优决策树的计算,并引入了一种新的分支定界方法,用于具有一般连续特征的最优决策树。第6章则转向在足够杂质减少条件下对CART算法的分析。我们为满足该条件的信号函数证明了严格的误差界,并讨论了一些满足该条件的函数类。 第7章研究了一种具有形状约束的密度估计问题。我们提出了一种立方-牛顿法框架用于计算,并研究了有限混合的逼近性质。

成为VIP会员查看完整内容
23

相关内容

麻省理工学院(Massachusetts Institute of Technology,MIT)是美国一所研究型私立大学,位于马萨诸塞州(麻省)的剑桥市。麻省理工学院的自然及工程科学在世界上享有极佳的盛誉,该校的工程系曾连续七届获得美国工科研究生课程冠军,其中以电子工程专业名气最响,紧跟其后的是机械工程。其管理学、经济学、哲学、政治学、语言学也同样优秀。
【MIT博士论文】高效深度学习计算的模型加速
专知会员服务
27+阅读 · 8月23日
论文浅尝 | 采用多层注意力机制的事件检测
开放知识图谱
23+阅读 · 2019年8月24日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
论文浅尝 | 远程监督关系抽取的生成式对抗训练
开放知识图谱
17+阅读 · 2018年7月12日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
Arxiv
156+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
137+阅读 · 2023年3月24日
Arxiv
20+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
微信扫码咨询专知VIP会员