【导读】本文为大家带来了一份斯坦福大学的最新课程CS246——大数据挖掘Mining Massive Data Sets,主讲人是斯坦福大牛Jure Leskovec,他是斯坦福大学计算机学院的副教授,也是图表示学习方法 node2vec 和 GraphSAGE 作者之一。
本课程将讨论用于分析大数据的数据挖掘和机器学习算法。重点将放在MapReduce和Spark作为创建并行算法的工具,这些算法可以处理非常大的数据。
原始链接:
http://web.stanford.edu/class/cs246/
1 课程介绍
主题包括: 频繁项集和关联规则,高维数据中的近邻搜索,局部敏感哈希(LSH),降维,推荐系统,聚类,链接分析,大规模监督机器学习,数据流,挖掘结构化数据的Web, Web广告。
2 讲师介绍
Jurij Leskovec
主讲人是图网络领域的大牛Jure Leskovec,是斯坦福大学计算机学院的副教授,也是图表示学习方法 node2vec 和 GraphSAGE 作者之一。在谷歌学术搜索(Google Scholar)上,Jure拥有接近10万+的论文引用数量,H指数为125。
Leskovec的研究重点是对大型社会和信息网络进行分析和建模,以研究跨社会,技术和自然世界的现象。他专注于网络结构、网络演化、信息传播、影响和病毒在网络上的传播的统计建模。他所研究的问题是由大规模数据、网络和其他在线媒体引起的。他也致力于文本挖掘和机器学习的应用。
个人主页:https://cs.stanford.edu/~jure/
3 课程目录
01:课程介绍和MapReduce and Spark(Introduction; MapReduce and Spark)
02:频繁项集挖掘(Frequent Itemsets Mining)
03:局部敏感哈希(Locality-Sensitive Hashing I)
04:局部敏感哈希(Locality-Sensitive Hashing II)
05:聚类(Clustering)
06:降维 (Dimensionality Reduction)
07:推荐系统(Recommender Systems I)
08:推荐系统(Recommender Systems II)
09:PageRank(PageRank)
10:链接欺诈与社交网络导论(Link Spam and Introduction to Social Networks)
11:社区检测(Community Detection in Graphs)
12:图表示学习(Graph Representation Learning)
13:图神经网络 Graph Neural Networks
14:嵌入学习 Learning Embeddings
15:大规模机器学习(Large-Scale Machine Learning I)
16:数据流挖掘(Mining Data Streams I)
17:计算广告(Computational Advertising)
18:通过实验学习(Learning through Experimentation)
19:优化子模块功能(Optimizing Submodular Functions)
4 课程材料预览
The following text is useful, but not required. It can be downloaded for free, or purchased from Cambridge University Press.
Leskovec-Rajaraman-Ullman: Mining of Massive Dataset
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“CS224” 可以获取《斯坦福CS224W《图机器学习》2021课程开始了!Jure Leskovec大牛主讲,附课程PPT下载》专知下载链接索引
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“CS246” 就可以获取《斯坦福CS246《大数据挖掘》2022课程开始了!Jure Leskovec大牛主讲,附课程PPT下载》专知下载链接