这本书作为本科和研究生的教材,旨在帮助那些愿意从理论和实践的角度理解机器学习基本要素的学生。选择本书中的主题是基于一个标准:某种方法的实用价值是否证明了它对于具有工程学和其他数量领域典型数学背景的学生的理论阐述是合理的。因此,这本书不仅包含实用的技术,而且以对研究生和高级本科生都容易理解的数学语言呈现它们。教材涵盖了一系列主题,包括最近的邻居、线性模型、决策树、集成学习、模型评估和选择、降维、组装各种学习阶段、聚类和深度学习,以及对数据科学和机器学习的基础Python包如NumPy、Pandas、Matplotlib、Scikit-Learn、XGBoost和Keras(基于TensorFlow后端)的介绍。鉴于Python编程语言在机器学习中的主导地位,该书通过Python实现来补充每种技术的理论介绍。在这方面,两章专门介绍必要的Python编程技能。这一特点使得这本书对于具有不同编程背景的学生来说是自给自足的,与假设读者具有先前Python编程经验的其他书籍形成鲜明对比。因此,本书的系统结构,以及所提供的许多示例和练习,将帮助读者更好地掌握内容,并具备日常机器学习应用所需的实践技能。 本书的组织结构如下:

  • 第1章为读者提供了关于机器学习的重要任务和概念的介绍。
  • 第2章和第3章专门讨论Python编程的基础。其中,第3章介绍了三个基本的Python包:1) numpy——许多数据科学库的核心基础包;2) pandas——基于numpy的数据分析库;3) matplotlib——Python中主要的绘图库。如果读者已经熟悉Python编程和上述三个包,那么可以完全跳过这两章。
  • 第4章在简要介绍scikit-learn之后,我们通过一个例子介绍和实践数据拆分、数据可视化、标准化、训练分类器(k-最近邻)、预测和评估。这一章也很重要,因为其中介绍的技术的Python实现将在书中多处和实际应用中被直接使用。
  • 第5章到第8章为读者提供了许多常用于设计过程中的分类器和回归器的详细数学机制。特别是,第5章从kNN开始,因为它简单且在该领域有着悠久的历史。第6章涵盖了被称为线性模型的机器学习方法的一个重要类别。第7章介绍了决策树。而第8章讨论了集成学习,涵盖了在许多应用中都有很强实践记录的集成学习技术。
  • 第9章讨论了评估模型性能的各种估计规则和指标。因为模型评估也对机器学习中的另一个突出问题——模型选择——至关重要,所以这一章涵盖了模型评估和选择。
  • 第10章涵盖了三种主要的特征选择方法,包括过滤、包裹和嵌入方法。
  • 第11章详细讨论了如何正确地实施所有这些步骤,以避免潜在的陷阱。 在第4章到第10章中,我们将看到这些步骤的有限实施,即这些步骤的部分实施,有时是孤立的,有时是与其他几步骤一起的。不过,第11章将详细探讨如何适当地实施这些步骤。 第12章讨论了一个重要的无监督学习任务,称为聚类。第4-12章中使用的主要软件是scikit-learn。然而,对于机器学习中使用的一个重要的预测模型类别——人工神经网络(ANNs),scikit-learn目前并不是最佳的软件选择。这是因为训练“深度”神经网络需要估计和调整许多参数和超参数,这在计算上是一个昂贵的过程。因此,成功训练各种形式的神经网络高度依赖于并行计算,这些并行计算是使用图形处理单元(GPUs)或张量处理单元(TPUs)实现的。但是,scikit-learn不支持使用GPU或TPU。与此同时,scikit-learn目前不支持实现某些流行的神经网络形式,如卷积神经网络或循环神经网络。因此,我们将ANNs和“深度学习”推迟到第13-15章。在那里,我们转向使用TensorFlow后端的Keras,因为它们非常适合训练和调整各种形式的ANN,并支持各种形式的硬件,包括CPU、GPU或TPU。在第13章中,我们讨论了许多用于训练深度神经网络(深度学习)的概念和技术。关于这一章中的架构选择,我们重点放在了多层感知器(MLP)上。卷积神经网络(CNNs)和循环神经网络(RNNs)分别在第14章和第15章中被介绍。

成为VIP会员查看完整内容
101

相关内容

Python是一种面向对象的解释型计算机程序设计语言,在设计中注重代码的可读性,同时也是一种功能强大的通用型语言。
【2023新书】2D计算机视觉:原理、算法与应用, 556页pdf
专知会员服务
92+阅读 · 2023年8月8日
【2023新书】数据空间: 设计、部署和未来方向, 367页pdf
专知会员服务
93+阅读 · 2023年5月27日
【2023新书】数据隐私:工程师的运行手册, 385页pdf
专知会员服务
62+阅读 · 2023年3月30日
【2023新书】机器学习中的表示学习,101页pdf
专知会员服务
126+阅读 · 2023年2月3日
【2022新书】机器学习中的统计建模:概念和应用,398页pdf
专知会员服务
139+阅读 · 2022年11月5日
【2022新书】应用深度学习:工具、技术与实现,355页pdf
专知会员服务
129+阅读 · 2022年7月26日
【MIT干货书】机器学习算法视角,126页pdf
专知会员服务
77+阅读 · 2021年1月25日
专知会员服务
50+阅读 · 2020年12月14日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
199+阅读 · 2020年2月11日
【2022新书】深度学习归一化技术,117页pdf
专知
24+阅读 · 2022年11月25日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
147+阅读 · 2023年3月24日
VIP会员
相关VIP内容
【2023新书】2D计算机视觉:原理、算法与应用, 556页pdf
专知会员服务
92+阅读 · 2023年8月8日
【2023新书】数据空间: 设计、部署和未来方向, 367页pdf
专知会员服务
93+阅读 · 2023年5月27日
【2023新书】数据隐私:工程师的运行手册, 385页pdf
专知会员服务
62+阅读 · 2023年3月30日
【2023新书】机器学习中的表示学习,101页pdf
专知会员服务
126+阅读 · 2023年2月3日
【2022新书】机器学习中的统计建模:概念和应用,398页pdf
专知会员服务
139+阅读 · 2022年11月5日
【2022新书】应用深度学习:工具、技术与实现,355页pdf
专知会员服务
129+阅读 · 2022年7月26日
【MIT干货书】机器学习算法视角,126页pdf
专知会员服务
77+阅读 · 2021年1月25日
专知会员服务
50+阅读 · 2020年12月14日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
199+阅读 · 2020年2月11日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员