2022新年荐书！最值得一读的8部机器学习教程（PDF下载）

在过去的几年里，有不少讲深度学习的书籍。今天给小伙伴们推荐8本关于AI和机器学习的经典书籍，大部分都有完整版PDF下载。

这8本书从内容上看，可以分为四类：

机器和深度学习基础知识（适合初学者）

机器学习框架：Pytorch、Tensorflow 和 Keras

MLOP：云、生产和深度学习工程

深度学习理论

机器学习和深度学习基础

Andriy Burkov：The Hundred-Page Machine Learning Book

如果你是新手，看这本书就很适合。如果是老手，可能会觉得这本书很无聊，讲的都是你已经知道的东西。

前两章重点介绍机器学习公式、符号和关键术语。随后，Burkov 分析了最重要的 ML 算法，如回归、决策树、支持向量机和 k-最近邻。

第 4 章是关于梯度下降和学习过程的，第 5 章是最佳实践的集合；即特征工程、正则化、超参数调整等。第 6 章专门介绍神经网络。

之后，Burkov 讨论了如何使用上述方法解决特定问题。书中解释了常见的机器学习挑战、陷阱以及有针对性的解决方案。最后讲到了无监督、自监督和推荐系统等内容。

Meor Amer：A visual introduction to Deep Learning

这本书非常适合喜欢通过直观视觉学习深度学习的人。

总的来说，我们发现这本书很容易理解，因为书中的图和文本之间处于很好的平衡。上一本100多页的书相比，这本书涉及的数学更少，插图更多。

书中在解释反向传播时非常关注细节，不会让读者迷失在数学中。不可否认，反向传播真的很难教，作者Meor在这方面做得很好。此外，书中还对混淆矩阵和 F1 分数等性能指标进行了彻底分析。

但是，这本书让编程人员可能不大方便。这本书讲的是理论的基本部分，但把代码留给读者去尝试。由于这本书的介绍比较笼统，理论和编程实践之间可能会有差距。

机器学习框架：Pytorch、Tensorflow、Keras

Eli Stevens, Luca Antiga, and Thomas Viehmann：Deep Learning with PyTorch

无论你处于什么阶段，要学习Pytorch大概都少不了这本书。本书分为3个部分。

第 1 部分：前 3 章介绍了 PyTorch 和张量操作。第 4 章从字面上描述了如何获取任何数据、视频或一行文本，并将其表示为张量，其中涵盖了医学图像、表格数据和带具体示例的文本，对于初学者，这些内容非常有价值。

第5、6章涵盖了使用简单神经网络（如反向传播）学习过程的所有基础知识，重点是讲如何在Pytorch 中的动手写代码。

第 2 部分讲的是面向现实问题的模型，包括从 3D 图像数据中检测癌症和肺结节等。这部分内容会引导读者完成整个设计和思考过程。作为机器学习建模人员，读者可以掌握需要遵循的所有必要步骤。

虽然我在这里有点偏见，但我喜欢这本书的这一部分，老实说，我认为这里介绍的方法可以转移到解决新问题上。

第 3 部分介绍了从 Pytorch 导出的模型，包括执行推理或移动设备所需的步骤。对于想要学习如何优化训练后模型，并在硬件资源有限的嵌入式设备中使用的工程师来说，这部分内容会很有帮助。

François Chollet：Deep Learning with Python（2nd Edition）

这本书基于 Keras 框架讲述深度学习。本书的第 2 版包含大量新增内容，强烈建议阅读第二版。前 4 章为新手基础知识，如张量运算、反向传播、基本的 Keras 模块，以及聚类和回归问题。

第 5 章分析了优化和泛化之间的权衡以及它与训练数据的关系。这一章节解释了为什么训练后的模型会通过逼近其数据的潜在流形实现泛化，并可以通过插值对新的输入做出高质量的预测。

第 6 章教你如何处理一个新的机器学习项目，包括设定切合实际的目标、收集数据、打破良好的基线和部署。第 7 章说明了如何更好地理解 Keras API 和回调。

第 8 章和第 9 章通过利用卷积神经网络进行图像分类和图像分割，全面概述了计算机视觉中的深度学习。第 10 章侧重于使用循环神经网络处理时间序列，第 11 章介绍了用于处理文本数据的Transformer架构。

第12章提出了各种生成模型来生成新的文本、图像。作者对生成对抗网络 (GAN) 、变分自动编码器 (VAE) 以及对潜在空间的解释和观点很有意思。

最后，本书涵盖了现实世界的高级概念，例如超参数调整、模型集成、混合精度训练、多 GPU 或多 TPU 训练等。

Laurence Moroney：AI and Machine Learning for Coders: A Programmer's Guide to Artificial Intelligence

如果你正在找有关 Tensorflow 的完整教程，这本书可能是最佳选择。Laurence Moroney 是 Google 的首席 AI 倡导者，在 Tensorflow 及其相关库方面拥有丰富的经验。

本书分为两部分。第一部分关于研究机器学习应用、如何利用 Tensorflow 来开发这些应用。包括计算机视觉、自然语言处理、时间序列分析和序列模型。在这部分可以学习如下内容：

如何使用 Tensorflow 构建 CNN 和 RNN；如何处理文本、图像和时间序列数据；如何利用 Tensorflow 数据集进行数据处理和探索。

第二部分是在实际应用中使用这些模型。读者将熟悉移动或 Web 应用程序上的模型部署。主要内容包括：

如何使用 Tensorflow Lite 在 Android 或 iOS 中嵌入模型；如何利用 Tensoflow.js；什么是 Tensorflow 服务、如何部署模型等。

这本书非常实用，有很多代码段和漂亮的可视化效果。

MLOP：云、生产和深度学习工程

Sergios Karagianakos：Deep learning in production

本书采用动手实践的方法来学习 MLOps。这本书的前提是，读者从一个深度学习模型开始，努力构建一个可扩展的 Web 应用程序。书中包含大量代码段和可视化效果，对于软件背景有限的机器学习研究人员和数据科学家来说，本书是个不错的资源。

书中各章节涉及机器学习生命周期的不同阶段。在讨论了设计阶段之后，读者将熟悉如何编写可维护的深度学习代码（如 OOP、单元测试和调试）的最佳实践。第 5 章是关于构建高效的数据管道，第 6 章涉及云中的模型训练以及各种分布式训练技术。

接着，本书讨论服务和部署技术，同时强调 Flask、uWSGI、Nginx 和 Docker 等工具。最后两章探讨了 MLOP。

更具体地说，是讨论如何使用 Kubernetes 扩展深度学习应用程序，如何使用 Tensorflow Extended 构建端到端pipeline，以及如何利用谷歌云和 Vertex AI。

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【教程】深度学习Keras与TensorFlow教程，Deep Learning with Keras and Tensorflow in R

专知会员服务

32+阅读 · 2022年3月9日

【Pytorch官方书】PyTorch 深度学习, 三部分15章节，522页pdf, 必备宝典, 通俗易懂

专知会员服务

210+阅读 · 2022年1月12日

【干货书】深度学习全面指南，307页pdf

专知会员服务

158+阅读 · 2022年1月6日

台大李宏毅《机器学习》2021课程撒花完结！除了视频、PPT，还有人汇编了一本答疑书

专知会员服务

80+阅读 · 2021年8月9日

【干货书】Python机器学习，361页pdf

专知会员服务

270+阅读 · 2021年2月25日

【经典书】数据挖掘和机器学习:基本概念和算法，附电子书与PPT

专知会员服务

167+阅读 · 2021年2月23日

【Pytorch官方新书】Pytorch深度学习（Deep Learning with PyTorch | PyTorch），附141页PDF，必备宝典, 通俗易懂

专知会员服务

458+阅读 · 2020年7月7日

【斯坦福】机器学习优化简明导论， Introduction to Optimization for Machine Learning

专知会员服务

93+阅读 · 2020年5月6日

【电子书】机器学习实战（Machine Learning in Action），附PDF

专知会员服务

130+阅读 · 2019年11月25日

【开源书】PyTorch深度学习起步，零基础入门(附pdf下载)

专知会员服务

114+阅读 · 2019年10月26日

8本机器学习宝典！2022新年荐书！最值得一读的8部机器学习教程（PDF下载）

专知

5+阅读 · 2022年1月11日

【UMD开放经典书】机器学习课程简明书，19章227页pdf，带你学习ML

专知

46+阅读 · 2019年12月9日

520 页机器学习笔记！图文并茂可能更适合你

大数据技术

19+阅读 · 2019年10月8日

吐血整理！10 个机器学习教程汇总，爱可可推荐！

大数据技术

17+阅读 · 2019年9月2日

美亚上最受欢迎的 10 本神经网络书籍

大数据技术

16+阅读 · 2019年3月19日

《机器学习100天》一份超全机器学习实战资料，初学者必备！

专知

21+阅读 · 2018年11月20日

381页机器学习数学基础PDF下载

专知

89+阅读 · 2018年10月9日

入门 | 一文介绍机器学习中基本的数学符号

机器之心

28+阅读 · 2018年4月9日

【下载】机器学习TensorFlow代码教程实战书籍和代码

专知

96+阅读 · 2017年12月2日

荐书丨深度学习入门之PyTorch

程序人生

18+阅读 · 2017年12月1日

六足机器人环境建模与自主运动规划

国家自然科学基金

4+阅读 · 2014年12月31日

基于语义理解的面向特定主题的微博舆情监控技术研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于视网膜感知机制和机器学习的工业视觉检测理论研究

国家自然科学基金

1+阅读 · 2013年12月31日

低秩矩阵恢复理论与算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向多示例数据标注的隐变量支持向量机研究

国家自然科学基金

0+阅读 · 2012年12月31日

关于压缩感知中一些算法的几个问题

国家自然科学基金

1+阅读 · 2012年12月31日

动态数据挖掘的构造性机器学习方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

统计学习中文问句分类方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

机器学习核方法模型选择与组合的核矩阵近似分析方法

国家自然科学基金

0+阅读 · 2011年12月31日

事件本体模型与应用技术

国家自然科学基金

3+阅读 · 2009年12月31日

A survey on improving NLP models with human explanations

Arxiv

0+阅读 · 2022年4月19日

On Parametric Optimal Execution and Machine Learning Surrogates

Arxiv

0+阅读 · 2022年4月18日

Twin-width can be exponential in treewidth

Arxiv

0+阅读 · 2022年4月15日

Curriculum Learning: A Survey

Arxiv

24+阅读 · 2021年1月25日

Aesthetics, Personalization and Recommendation: A survey on Deep Learning in Fashion

Arxiv

13+阅读 · 2021年1月20日

A Survey on Trajectory Data Management, Analytics, and Learning

Arxiv

16+阅读 · 2020年3月25日

A survey on Semi-, Self- and Unsupervised Techniques in Image Classification

Arxiv

100+阅读 · 2020年2月20日

Deep Learning in Video Multi-Object Tracking: A Survey

Arxiv

58+阅读 · 2019年7月31日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

VIP会员

相关内容

知识荟萃

更多