【下载】Scikit-learn作者新书《Python机器学习导论》, 教程+代码手把手带你实践机器学习算法

2017 年 12 月 4 日 专知 专知内容组(编)
【下载】Scikit-learn作者新书《Python机器学习导论》, 教程+代码手把手带你实践机器学习算法

点击上方“专知”关注获取专业AI知识!

【导读】哥伦比亚大学老师Andreas C. Müller同时也是著名机器学习Python包scikit-learn的主要贡献者 Andreas Muller 和 Reonomy 公司数据科学家 Sarah Guido 的新书《Python机器学习导论》(Introduction to machine learning with Python)从实战角度出发带你用Python快速上手机器学习方法。随书同时提供代码和Jupyter Notebook,可以让你动手调试改进。


请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知),

  • 后台回复“MLPY” 就可以获取Andreas Muller的Python机器学习导论 pdf下载~


目录



1. 简介

2. 有监督学习

3. 无监督学习和预处理

4. 数据表示和特征工程

5. 模型评估与提高

6. 算法实践流程

7. 文本数据处理

8. 实践经验总结

图书介绍




机器学习已经成为许多商业应用和研究项目的一个不可缺少的组成部分,但是这个领域并不是拥有大型研究团队大型公司的专属。如果您使用Python(即使是作为初学者)本书将教您如何构建自己的机器学习解决方案。如今我们可以方便地获取所有数据,而机器学习应用仅受限于您的想象力。


您将学习使用Python和scikit-learn库创建一个成功的机器学习应用程序所需的步骤。作者Andreas Muller和Sarah Guido将重点关注机器学习算法的实践方法,而不是背后繁杂的数学。对NumPy和matplotlib库的熟悉将帮助您从本书中获得更多。


有了这本书,你会学到:

  • 机器学习的基本概念和应用

  • 被广泛使用的机器学习算法的优点和缺点。

  • 如何用机器学习方法表示数据处理过程,包括数据的哪些方面要关注。

  • modeI评估和调整参数的高级方法。

  • 用于链式模型流程的概念和和如何封装你的工作流程。

  • 处理文本数据的方法,包括针对特定文本类型的处理。

  • 关于提高机器学习和数据科学技能的建议


图书配套Github代码




该代码库包含Andreas Mueller和Sarah Guido即将出版的书“Python机器学习导论”的代码。 您可以在O'Reilly网站上找到有关该书的详细信息。


本书主要使用scikit-learn的开发版本,即0.18-dev。 本书的大部分内容也可以同样用于scikit-learn的早期版本,但是您需要调整model_selection模块的所有内容(主要是cross_val_score,train_test_split和GridSearchCV)

该代码库提供了书中的jupyter notebook代码,以及用于创建图形和数据集的helper函数的mglearn库。

回应好奇者,本书封面图片是一个(北美)大鲵鱼。

除了aclImdb数据集之外,所有数据集都包含在代码库中,您可以从Andrew Maas的页面下载该数据(http://ai.stanford.edu/~amaas/data/sentiment/)。 详细信息请参阅本书。

如果你遇到ImportError:No module named mglearn,你可以尝试在你的终端上使用命令pip install mglearn来安装mglearn到你的python环境中,或者在Jupyter Notebook中!pip install mglearn。

勘误

请注意,在列出导入python包时,本书的第一个版本缺少以下行:

from IPython.display import display

如果您看到涉及显示的错误,请添加此行。

本书的第一个版本使用了一个名为plot_group_kfold的函数。 由于在scikit-learn中被重命名了,这已经重命名为plot_label_kfold。

代码使用方法

运行代码,你需要用到如下包: numpy, scipy, scikit-learn, matplotlib, pandas ,pillow。 一些决策树和神经网络结构的可视化也需要graphviz。

设置环境的最简单方法是安装Anaconda。

使用conda安装软件包:

如果您已经设置了Python环境,并且正在使用conda软件包管理器,则可以通过运行下面的代码来获取所有软件包:

conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz 
python-graphviz

使用pip安装软件包:

如果您已经设置了Python环境,并且正在使用pip安装包,则可以通过运行下面的代码:

pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz

您还需要安装graphiz C库,这是使用包管理器最简单的方法。 如果您使用的是OS X和或制软件,则可以安装graphviz。 如果你在Ubuntu或Debian上,你可以通过apt-get install graphviz安装。 在Windows上安装graphviz可能会非常棘手,建议使用conda / anaconda。

提交勘误

如果您发现电子书的错误,请通过O'Reilly网站提交。 你可以在这里提交固定的代码作为pull-requests,如果你也在这里提交它们,我会很感激的,因为这个版本库并不包含“master notebooks”。


参考链接:

https://github.com/amueller/introduction_to_ml_with_python


▌详细目录




▌第一部分 简介




▌第二部分 有监督学习




▌第三部分 无监督学习和预处理




▌第四部分 数据表示和特征工程




▌第五部分 模型评估与提高





▌第六部分 算法实践流程




▌第七部分 文本数据处理




▌第八部分 实践经验总结




-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域24个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

同时欢迎各位用户进行专知投稿,详情请点击

诚邀】专知诚挚邀请各位专业者加入AI创作者计划了解使用专知!

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!

请扫一扫加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!

点击“阅读原文”,使用专知!

登录查看更多
38

相关内容

机器学习已经成为许多商业应用和研究项目中不可或缺的一部分,但这一领域并不仅限于拥有广泛研究团队的大公司。如果您使用Python,即使是初学者,这本书也会教你构建自己的机器学习解决方案的实用方法。今天,有了所有可用的数据,机器学习应用程序只受限于你的想象力。

您将学习使用Python和scikit-learn库创建成功的机器学习应用程序所需的步骤。两位作者安德烈亚斯•穆勒(Andreas Muller)和萨拉•圭多(Sarah Guido)关注的是使用机器学习算法的实践层面,而不是背后的数学。熟悉NumPy和matplotlib库将有助于您从本书获得更多信息。

通过这本书,你会学到 :

  • 机器学习的基本概念和应用
  • 广泛应用的机器学习算法的优缺点
  • 如何表示机器学习处理过的数据,包括关注哪些数据方面
  • 先进的模型评估和参数调整方法
  • 用于链接模型和封装工作流的管道概念
  • 处理文本数据的方法,包括特定于文本的处理技术
  • 提高机器学习和数据科学技能的建议
成为VIP会员查看完整内容
0
93

本书通过提供真实的案例研究和示例,为使用Python库进行机器学习提供了坚实的基础。它涵盖了诸如机器学习基础、Python入门、描述性分析和预测分析等主题。包括高级机器学习概念,如决策树学习、随机森林、增强、推荐系统和文本分析。这本书在理论理解和实际应用之间采取了一种平衡的方法。所有的主题都包括真实世界的例子,并提供如何探索、构建、评估和优化机器学习模型的逐步方法。

成为VIP会员查看完整内容
Machine Learning using Python by Manaranjan Pradhan.pdf
0
210

掌握通过机器学习和深度学习识别和解决复杂问题的基本技能。使用真实世界的例子,利用流行的Python机器学习生态系统,这本书是你学习机器学习的艺术和科学成为一个成功的实践者的完美伴侣。本书中使用的概念、技术、工具、框架和方法将教会您如何成功地思考、设计、构建和执行机器学习系统和项目。

使用Python进行的实际机器学习遵循结构化和全面的三层方法,其中包含了实践示例和代码。

第1部分侧重于理解机器学习的概念和工具。这包括机器学习基础,对算法、技术、概念和应用程序的广泛概述,然后介绍整个Python机器学习生态系统。还包括有用的机器学习工具、库和框架的简要指南。

第2部分详细介绍了标准的机器学习流程,重点介绍了数据处理分析、特征工程和建模。您将学习如何处理、总结和可视化各种形式的数据。特性工程和选择方法将详细介绍真实数据集,然后是模型构建、调优、解释和部署。

第3部分探讨了多个真实世界的案例研究,涵盖了零售、交通、电影、音乐、营销、计算机视觉和金融等不同领域和行业。对于每个案例研究,您将学习各种机器学习技术和方法的应用。动手的例子将帮助您熟悉最先进的机器学习工具和技术,并了解什么算法最适合任何问题。

实用的机器学习与Python将授权您开始解决您自己的问题与机器学习今天!

你将学习:

  • 执行端到端机器学习项目和系统
  • 使用行业标准、开放源码、健壮的机器学习工具和框架实现实践示例
  • 回顾描述机器学习和深度学习在不同领域和行业中的应用的案例研究
  • 广泛应用机器学习模型,包括回归、分类和聚类。
  • 理解和应用深度学习的最新模式和方法,包括CNNs、RNNs、LSTMs和transfer learning。

这本书是给谁看的 IT专业人士、分析师、开发人员、数据科学家、工程师、研究生

目录:

Part I: Understanding Machine Learning

  • Chapter 1: Machine Learning Basics
  • Chapter 2: The Python Machine Learning Ecosystem Part II: The Machine Learning Pipeline
  • Chapter 3: Processing, Wrangling and Visualizing Data
  • Chapter 4: Feature Engineering and Selection
  • Chapter 5: Building, Tuning and Deploying Models Part III: Real-World Case Studies
  • Chapter 6: Analyzing Bike Sharing Trends
  • Chapter 7: Analyzing Movie Reviews Sentiment
  • Chapter 8: Customer Segmentation and Effective Cross Selling
  • Chapter 9: Analyzing Wine Types and Quality
  • Chapter 10: Analyzing Music Trends and Recommendations
  • Chapter 11: Forecasting Stock and Commodity Prices

Chapter 12: Deep Learning for Computer Vision

成为VIP会员查看完整内容
0
141
小贴士
相关资讯
《机器学习实战》代码(基于Python3)
专知
26+阅读 · 2019年10月14日
下载 | 100页机器学习入门完整版,初学者必备!
机器学习算法与Python学习
8+阅读 · 2018年12月18日
459页《Python深度学习》下载
机器学习算法与Python学习
12+阅读 · 2018年10月29日
180页机器学习Python简介教程【免费下载】
机器学习算法与Python学习
5+阅读 · 2018年8月18日
相关VIP内容
相关论文
Wenwu Zhu,Xin Wang,Peng Cui
18+阅读 · 2020年1月2日
A Modern Introduction to Online Learning
Francesco Orabona
14+阅读 · 2019年12月31日
Joost Verbraeken,Matthijs Wolting,Jonathan Katzy,Jeroen Kloppenburg,Tim Verbelen,Jan S. Rellermeyer
26+阅读 · 2019年12月20日
Towards Automated Machine Learning: Evaluation and Comparison of AutoML Approaches and Tools
Anh Truong,Austin Walters,Jeremy Goodsitt,Keegan Hines,C. Bayan Bruss,Reza Farivar
3+阅读 · 2019年9月3日
Claudio Gambella,Bissan Ghaddar,Joe Naoum-Sawaya
7+阅读 · 2019年1月16日
UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction
Leland McInnes,John Healy,James Melville
7+阅读 · 2018年12月6日
Diverse Image-to-Image Translation via Disentangled Representations
Hsin-Ying Lee,Hung-Yu Tseng,Jia-Bin Huang,Maneesh Kumar Singh,Ming-Hsuan Yang
11+阅读 · 2018年8月2日
Konstantinos Skianis,Nikolaos Tziortziotis,Michalis Vazirgiannis
6+阅读 · 2018年7月12日
Avik Ray,Joe Neeman,Sujay Sanghavi,Sanjay Shakkottai
3+阅读 · 2018年2月24日
Vincent Dumoulin,Francesco Visin
6+阅读 · 2018年1月11日
Top