本课程涵盖了机器学习和统计建模方面的广泛主题。 虽然将涵盖数学方法和理论方面,但主要目标是为学生提供解决实际中发现的数据科学问题所需的工具和原理。 本课程还可以作为基础,以提供更多专业课程和进一步的独立学习。 本课程是数据科学中心数据科学硕士学位课程核心课程的一部分。 此类旨在作为DS-GA-1001数据科学概论的延续,其中涵盖了一些重要的基础数据科学主题,而这些主题可能未在此DS-GA类中明确涵盖。
课程大纲
- Week 1:统计学习理论框架
- Week 2:随机梯度下降
- Week 3:正则化,Lasso, 和 Elastic网,次梯度方法
- Week 4:损失函数,SVM,代表定理
- Week 5:核方法
- Week 6:最大似然,条件概率
- Week 7:期中
- Week 8:贝叶斯方法
- Week 9:贝叶斯条件概率,多分类
- Week 10:分类和回归树
- Week 11:bagging和随机森林,梯度提升
- Week 12:K-Means,高斯混合模型
- Week 13:EM算法
- Week 14:神经网络,反向传播