一 1. Machine Learning for Absolute Beginners: A Plain English Introduction 作者:Oliver Theobald 难度等级:初学者 如标题所述,如果你是Machine Learning的初学者,那么这本书应该是你的切入点。需要很少或几乎没有编码 或数学背景,在这本书已经全部概念解释的很清楚。 实例后面是视觉效果,以友善的方式介绍主题,以了解ML的重要性。 Oliver Theobald在他的书中简化了与ML相关的几个复杂主题,例如其基础知识,以及其他技术,例如数据清理,回归分析,聚类,偏差,人工神经网络等。该书还提供了进一步学习的其他资源。
九 9. Machine Learning for Hackers: Case Studies and Algorithms to Get You Started 作者:Drew Conway和John Myles 难度等级:中级 就像标题所说的那样,本书不适合黑客使用,而是适合那些对动手案例研究感兴趣的人。本书要求有很强的编程背景,旨在通过驱动机器学习的算法来训练你。各个章节集中讨论了ML中的每个问题,例如分类,优化,预测和建议。 这本书还训练你使用R语言,以及如何分析数据集并开始编写简单的ML算法。它与其他书籍不同的一个重要差异是对数学的依赖低。
十 10. Programming Collective Intelligence: Building Smart Web 2.0 Applications 作者:Toby Segaran 难度等级:中级 假设你知道Python,这本书被许多人认为是机器学习的最佳指南,它更愿意教你ML的实现。它包括创建用于访问网站上的数据集的算法和程序,自行收集数据以及分析和利用数据的步骤。 本书将向你介绍ML和统计信息,其中包括爬虫,索引器,优化,PageRank算法,过滤技术,决策树的示例。本书旨在按照你的步调逐步指导你完成算法的整个过程,因此出色地完成了其工作。
十一 11. The Elements of Statistical Learning: Data Mining, Inference, and Prediction 作者:Trevor Hastie,Robert Tibshirani和Jerome Friedman 难度等级:专家 本书侧重于概念,而不是概念背后的数学。它收集了有关在多个部门实施统计学习的大量想法。充斥着相关的示例和可视化内容,它应该是任何统计学家或数据挖掘爱好者的图书馆中必不可少的部分。 本书涵盖有监督和无监督的学习,包括支持向量机,分类树,神经网络,Boosting,集成方法,图形模型,光谱聚类,最小角度回归和路径算法等主题。