这是一门基于研究的机器学习数据系统(ML)课程,在ML/AI、数据管理和系统领域的交叉。这些系统为大型复杂数据集的现代数据科学应用提供了强大的动力,包括企业分析、推荐系统和社交媒体分析。学生们将了解这些系统的景观和进化以及最新的研究。这是一门以讲座为导向的课程,包括测验、考试和论文复习。它主要是为硕士学生、博士学生和对可扩展数据科学和ML工程系统的最新技术感兴趣的高级本科生量身定制的。
本课程将涵盖基于ML的数据分析的整个生命周期的关键系统主题,包括ML的数据来源和准备,可扩展ML模型构建的编程模型和系统,以及快速ML部署的系统。还可能会涉及到诸如ML系统的治理、解释和伦理等新兴主题。本课程的一个主要部分是回顾最近在这些主题上的顶级会议的前沿研究论文。请参阅课程进度表页面,了解整个主题列表,以及论文阅读列表。