【经典书】数据挖掘和机器学习:基本概念和算法,附电子书与PPT

2021 年 2 月 23 日 专知


数据挖掘和机器学习的基本算法构成了数据科学的基础,利用自动化方法分析各种数据的模式和模型,应用范围从科学发现到商业分析。本教材面向本科和研究生课程,全面深入地介绍了数据挖掘、机器学习和统计学,为学生、研究人员和实践者提供了坚实的指导。这本书奠定了数据分析、模式挖掘、聚类、分类和回归的基础,集中在算法和潜在的代数、几何和概率概念上。新的第二版是一个完整的部分致力于回归方法,包括神经网络和深度学习。


  • 涵盖核心方法和前沿研究,包括深度学习


  • 提供了一种基于开源实现的算法方法


  • 包含了经过类测试的例子和练习,允许课程设计的灵活性和现成的参考


数据挖掘和机器学习使人能够从数据中获得基本的见解和知识。它们允许发现深刻的、有趣的和新颖的模式,以及从大规模数据中描述的、可理解的和可预测的模型。在这个领域有几本好书,但其中很多不是太高级就是太高级。这本书是一个介绍性的文本,奠定了机器学习和数据挖掘的基本概念和算法的基础。重要的概念在第一次遇到时就会被解释,并附有详细的步骤和推导。本书的主要目标是通过对数据和方法的几何、(线性)代数和概率解释的相互作用,建立公式背后的直觉。这第二版在回归上增加了一个完整的新部分,包括线性和逻辑回归,神经网络,和深度学习。其他章节的内容也进行了更新,已知的勘误表也得到了修正。本书的主要部分包括数据分析基础、频繁模式挖掘、聚类、分类和回归。这些课程涵盖了核心方法以及尖端主题,如深度学习、核方法、高维数据分析和图分析。


深度学习,核方法,高维数据分析,图分析。这本书包括许多例子来说明概念和算法。它也有结束语练习,在课堂上使用过。书中所有的算法都是由作者实现的。为了帮助实际理解,我们建议读者自己实现这些算法(例如,使用Python或R)。如幻灯片、数据集和视频等补充资源可以在该书的同伴站点在线获得:


http://dataminingbook.info


目录内容:

  • Front Matter

  • Contents

  • Preface

  • PART I. DATA ANALYSIS FOUNDATIONS

    • 1 Data Mining and Analysis

    • 2 Numeric Attributes

    • 3 Categorical Attributes

    • 4 Graph Data

    • 5 Kernel Methods

    • 6 High-dimensional Data

    • 7 Dimensionality Reduction

  • PART II. FREQUENT PATTERN MINING

    • 8 Itemset Mining

    • 9 Summarizing Itemsets

    • 10 Sequence Mining

    • 11 Graph Pattern Mining

    • 12 Pattern and Rule Assessment

  • PART III. CLUSTERING

    • 13 Representative-based Clustering

    • 14 Hierarchical Clustering

    • 15 Density-based Clustering

    • 16 Spectral and Graph Clustering

    • 17 Clustering Validation

  • PART IV. CLASSIFICATION

    • 18 Probabilistic Classification

    • 19 Decision Tree Classifier

    • 20 Linear Discriminant Analysis

    • 21 Support Vector Machines

    • 22 Classification Assessment

  • PART V. REGRESSION

    • 23 Linear Regression

    • 24 Logistic Regression

    • 25 Neural Networks

    • 26 Deep Learning

    • 27 Regression Evaluation

  • Index


Slides:

PART I. DATA ANALYSIS FOUNDATIONS

  • 1 Data Mining and Analysis: Chap1 PDF, Chap1 PPT

  • 2 Numeric Attributes: Chap2 PDF, Chap2 PPT

  • 3 Categorical Attributes: Chap3 PDF, Chap3 PPT

  • 4 Graph Data: Chap4 PDF, Chap4 PPT

  • 5 Kernel Methods: Chap5 PDF, Chap5 PPT

  • 6 High-dimensional Data: Chap6 PDF, Chap6 PPT

  • 7 Dimensionality Reduction: Chap7 PDF, Chap7 PPT

PART II. FREQUENT PATTERN MINING

  • 8 Itemset Mining: Chap8 PDF, Chap8 PPT

  • 9 Summarizing Itemsets: Chap9 PDF, Chap9 PPT

  • 10 Sequence Mining: Chap10 PDF, Chap10 PPT

  • 11 Graph Pattern Mining: Chap11 PDF, Chap11 PPT

  • 12 Pattern and Rule Assessment: Chap12 PDF, Chap12 PPT

PART III. CLUSTERING

  • 13 Representative-based Clustering: Chap13 PDF, Chap13 PPT

  • 14 Hierarchical Clustering: Chap14 PDF, Chap14 PPT

  • 15 Density-based Clustering: Chap15 PDF, Chap15 PPT

  • 16 Spectral and Graph Clustering: Chap16 PDF, Chap16 PPT

  • 17 Clustering Validation: Chap17 PDF, Chap17 PPT

PART IV. CLASSIFICATION

  • 18 Probabilistic Classification: Chap18 PDF, Chap18 PPT

  • 19 Decision Tree Classifier: Chap19 PDF, Chap19 PPT

  • 20 Linear Discriminant Analysis: Chap20 PDF, Chap20 PPT

  • 21 Support Vector Machines: Chap21 PDF, Chap21 PPT

  • 22 Classification Assessment: Chap22 PDF, Chap22 PPT

PART V. REGRESSION

  • 23 Linear Regression: Chap23 PDF, Chap23 PPT

  • 24 Logistic Regression: Chap24 PDF, Chap24 PPT

  • 25 Neural Networks: Chap25 PDF, Chap25 PPT

  • 26 Deep Learning: Chap26 PDF, Chap26 PPT

  • 27 Regression Evaluation: Chap27 PDF, Chap27 PPT



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DMML” 可以获取《【经典书】数据挖掘和机器学习:基本概念和算法,附电子书与PPT》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
3

相关内容

CHAP:挑战握手认证协议 (Challenge Handshake Authentication Protocol) 挑战握手认证协议(CHAP,Challenge-Handshake Authentication Protocol)是在网络物理连接后进行连接安全性验证的协议。它比另一种协议密码验证程序(PAP)更加可靠。 挑战握手认证协议(CHAP)通过 三次握手周期性的校验对端的身份,在初始链路建立时完成,可以在链路建立之后的任何时候重复进行。
专知会员服务
78+阅读 · 2021年5月4日
923页ppt!经典课《机器学习核方法》,附视频
专知会员服务
104+阅读 · 2021年3月1日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
【干货书】《机器学习导论(第二版)》,348页pdf
专知会员服务
239+阅读 · 2020年6月16日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
331+阅读 · 2020年3月17日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
199+阅读 · 2020年2月7日
246 页《统计机器学习与凸优化》教程 PPT 下载
新智元
24+阅读 · 2018年9月21日
关于数据挖掘,有几本书推荐给你......
图灵教育
15+阅读 · 2017年10月11日
Arxiv
0+阅读 · 2021年5月2日
Arxiv
3+阅读 · 2020年9月30日
Arxiv
7+阅读 · 2019年5月31日
Arxiv
5+阅读 · 2019年4月25日
Arxiv
6+阅读 · 2018年12月10日
Learning to Focus when Ranking Answers
Arxiv
5+阅读 · 2018年8月8日
VIP会员
相关VIP内容
专知会员服务
78+阅读 · 2021年5月4日
923页ppt!经典课《机器学习核方法》,附视频
专知会员服务
104+阅读 · 2021年3月1日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
【干货书】《机器学习导论(第二版)》,348页pdf
专知会员服务
239+阅读 · 2020年6月16日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
331+阅读 · 2020年3月17日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
199+阅读 · 2020年2月7日
相关论文
Arxiv
0+阅读 · 2021年5月2日
Arxiv
3+阅读 · 2020年9月30日
Arxiv
7+阅读 · 2019年5月31日
Arxiv
5+阅读 · 2019年4月25日
Arxiv
6+阅读 · 2018年12月10日
Learning to Focus when Ranking Answers
Arxiv
5+阅读 · 2018年8月8日
Top
微信扫码咨询专知VIP会员