本文介绍了一阶优化方法及其在机器学习中的应用。这不是一门关于机器学习的课程(特别是它不涉及建模和统计方面的考虑),它侧重于使用和分析可以扩展到具有大量参数的大型数据集和模型的廉价方法。这些方法都是围绕“梯度下降”的概念而变化的,因此梯度的计算起着主要的作用。本课程包括最优化问题的基本理论性质(特别是凸分析和一阶微分学)、梯度下降法、随机梯度法、自动微分、浅层和深层网络。
参考地址:
https://mathematical-tours.github.io
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“OPML” 就可以获取《机器学习最优化课程笔记,38页pdf,Optimization for Machine Learning》专知下载链接