送你10本机器学习和数据科学必读书(附PDF下载)

2018 年 7 月 13 日 数据派THU


作者:Matthew Mayo

翻译:肖镇东

校对:梁傅淇

本文共1800字,建议阅读6分钟。
让一系列免费的机器学习与数据科学书籍开启你的夏日学习之旅吧!

在读完本文列出的书单之后,如果你想要更多免费、高质量的书单,可以查看这个系列之前的帖子:


https://www.kdnuggets.com/2017/04/10-free-must-read-books-machine-learning-data-science.html


 公众号后台回复关键字“1807”

即可获得本文书籍PDF版本



1. Python Data Science Handbook


链接:

https://github.com/jakevdp/PythonDataScienceHandbook

作者:Jake VanderPlas


这本书介绍了在Python中处理数据所需要的基本而重要的库,包括IPython、NumPy、Pandas、Matplotlib、Scikit-Learn和其他相关的包。该书假定读者对Python语言有一定的了解。如果你需要快速入门Python这门语言,可以查看免费的配套项目:


A Whirlwind Tour of Python:

https://github.com/jakevdp/WhirlwindTourOfPython


它会帮助研究员和科学家快速入门Python。


2. Neural Networks and Deep Learning


链接:

http://neuralnetworksanddeeplearning.com/
作者:Michael Nielsen


Neural Networksand Deep Learning是一本在线书籍。这本书会告诉你:


  • 神经网络是一种优美的仿生编程范例,它使得计算机能够通过观测数据进行学习。

  • 度学习是一系列强大的技术, 以帮助实现在神经网络中学习。


神经网络和深度学习目前是图像识别、语言识别和自然语言处理等领域的最佳方案。该书同时也会教你神经网络与深度学习的各种核心概念。

 
3. Think Bayes


链接:

http://greenteapress.com/wp/think-bayes/

作者:Allen B. Downey


Think Bayes是介绍如何通过编程方法进行贝叶斯统计的书籍。


这本书和其他Think X系列书籍的想法一样,他们认为只要你知道如何编程,那么你就可以通过这项技能来学习其他的课题。


大多数的贝叶斯统计书籍会使用数学符号并且通过微积分一类的数学概念来展现其统计思想。这本书则使用Python代码、离散逼近而非数学、连续数学来解释贝叶斯统计。通过这样的方式,在数学书里的积分,将会转变为求和。许多在概率分布上的操作将会通过简单的循环而实现。


4. Machine Learning & Big Data


链接:

http://www.kareemalkaseer.com/books/ml

作者:Kareem Alkaseer


这本书还没写完,我把它添加到表单,你可以稍后才看[H1] 。这个项目的目的在于平衡软件工程师的理论与实践,使他们能轻松地运行机器学习模型而并不需要过分依赖各种各样的库。大多数时候,模型或技术背后的概念是简单而直观的,但却在大量的细节或者术语中被掩盖了。同时,大多数情况下,现有的库能够解决手头的问题,但是他们却被视作一个黑盒子,通常因他们自身的抽象与架构隐藏了背后的基本概念。这本书将阐释这些基本概念。

 

5. Statistical Learning with Sparsity: 

The Lasso andGeneralizations


链接:

https://web.stanford.edu/~hastie/StatLearnSparsity/
作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright


过去的十年里,计算和信息技术出现了爆炸性增长,同时出现了大量的源自不同领域的数据,例如医疗、生物、金融和市场营销。这本书将在一个通用的概念性框架下来讲解这些领域的重要思想。


6. Statistical inference for data science


链接:

https://leanpub.com/LittleInferenceBook

作者:Brian Caffo


这本书是Coursera数据科学项目(Data Science Specialization)中的统计推断(Statistical Inference)课程配套书籍。但是你并不需要上这门课,因为这本书的大部分内容可以独立使用。这本书其中一个重要的部分是一系列组成Coursera 课程的Youtube视频。这本书的出版诣在提供一个成本低廉的统计推断入门。目标读者是有数学或计算机背景的并且希望在统计和数据科学领域中得以运用的学生。这本书在Github上以markdown文档的形式免费提供。同时也以更便捷的形式(epub,mobi)在LeanPub和零售店提供。


7. Convex Optimization


链接:

http://stanford.edu/~boyd/cvxbook/

作者:Stephen Boyd,Lieven Vandenberghe


这本书是关于凸优化的,即一类数学优化问题,包括最小二乘方和线性规划。众所周知,最小二乘方和线性规划是非常完整的理论,它们有着各式各样的应用,并且可以用数学的方法高效地得出解。这本书的中心即阐述更多的凸优化问题。


8. Natural Language Processing 

with Python


链接:

https://www.nltk.org/book/

作者:Steven Bird,Ewan Klein,Edward Loper


这是一本关于自然语言处理的书。“自然语言”指的是人类日常交流使用的语言,例如英语、印度语和葡萄牙语。相较于数学符号、编程语言等人造语言,自然语言在时代变迁中不断进化,很难通过明确的规则来界定。我们这里定义的是广义上的自然语言处理,本书将会介绍计算机对自然语言各种形式的操作。


这本书基于Python语言,并同时提供名叫Natural Language Toolkit的开放资源库。


9. Automate the Boring Stuff 

with Python


链接:

https://automatetheboringstuff.com/

作者:Al Sweigart


如果你曾花过数小时时间在文件重命名和更新数百个电子表格数据上,那么你知道这些工作有多么枯燥乏味。但如果你能够让电脑可以帮你做这些呢?


这本书里,你会学习如何使用Python来编辑程序,来代替你做需要花几个小时的事情,并且你不需要有编程基础。当你很纯熟地掌握这些编程基础,你将能够使用Python编程毫不费力地实现许多有用并惊艳的自动化特技。

 

10. Social Media Mining: An Introduction


链接:

http://dmml.asu.edu/smm/
作者:Reza Zafarani, Mohammad Ali Abbasi and Huan Liu


过去十年中,社交媒体颠覆了个体的交流和行业间的经营方式。个体以史无前例的速度通过在社交媒体上交流、分享和消费内容产生大量数据。理解和分析这类新数据来收集可行的模型成为了交叉领域研究、新型算法和工具开发所面临的新机遇与新挑战。这本书结合了社交媒体,社交网络分析和数据挖掘,帮助学生、从业者、研究员和项目经理快速、清晰地理解社交媒体挖掘的基础和未来的可能性。

 公众号后台回复关键字“1807”

即可获得本文书籍PDF版本


原文标题:

10 More Free Must-Read Books for Machine Learning and Data Science

原文链接:

https://www.kdnuggets.com/2018/05/10-more-free-must-read-books-for-machine-learning-and-data-science.html

译者简介

肖镇东,墨尔本大学金融系毕业。因受到计量教授们的启发,对数据产生了兴趣。怀揣着一个科研梦,希望能在将来攻读数学博士,而后在大学任教并从事商业数据的研究。

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。


点击文末“阅读原文”加入数据派团队~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:datapi),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。


点击“阅读原文”拥抱组织

登录查看更多
4

相关内容

【2020新书】监督机器学习,156页pdf,剑桥大学出版社
专知会员服务
151+阅读 · 2020年6月27日
【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
机器学习速查手册,135页pdf
专知会员服务
338+阅读 · 2020年3月15日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
192+阅读 · 2020年3月12日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
421页《机器学习数学基础》最新2019版PDF下载
人工智能入门书单(附PDF链接)
AI前线
22+阅读 · 2018年8月2日
10本必读的机器学习和数据科学免费在线电子书
算法与数据结构
11+阅读 · 2018年6月19日
世界读书日 | 机器学习必读书籍一览表(附阅读地址)
七月在线实验室
6+阅读 · 2018年4月23日
七本书籍带你打下机器学习和数据科学的数学基础
Arxiv
35+阅读 · 2020年1月2日
Arxiv
45+阅读 · 2019年12月20日
Arxiv
22+阅读 · 2019年11月24日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
3+阅读 · 2018年12月18日
Arxiv
5+阅读 · 2018年10月11日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
15+阅读 · 2018年6月23日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
相关VIP内容
【2020新书】监督机器学习,156页pdf,剑桥大学出版社
专知会员服务
151+阅读 · 2020年6月27日
【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
机器学习速查手册,135页pdf
专知会员服务
338+阅读 · 2020年3月15日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
192+阅读 · 2020年3月12日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
相关论文
Arxiv
35+阅读 · 2020年1月2日
Arxiv
45+阅读 · 2019年12月20日
Arxiv
22+阅读 · 2019年11月24日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
3+阅读 · 2018年12月18日
Arxiv
5+阅读 · 2018年10月11日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
15+阅读 · 2018年6月23日
Arxiv
25+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员