机器学习和数据科学领域必读的10本免费书籍

2018 年 6 月 18 日 云栖社区

云栖君导读:在这个暑假,有兴趣的可以阅读一下这些免费的有关机器学习和数据科学的书籍,他们能给你打开一扇看清机器学习和数据科学的窗。



1. Python Data Science Handbook


作者:Jake VanderPlas


本书介绍了在Python中处理数据所必需的核心库,特别是IPython,NumPy,Pandas,Matplotlib,Scikit-Lean和相关的软件包。在此之前您需要掌握Python这种语言,如果您想快速掌握这门语言,可以参阅这个针对研究人员和科学家的Python语言快速入门的“Python的旋风之旅(A Whirlwind Tour of Python)”。


书籍地址:

https://github.com/jakevdp/PythonDataScienceHandbook


2. Neural Networks and Deep Learning


作者:Michael Nielsen


这是一本免费的在线书籍。通过这本书你会知道神经网络是一个美丽的生物启发式编程范例,使计算机可以从观测数据中学习。而深度学习则是一套强大的神经网络学习技术。


目前,神经网络和深度学习为图像识别、语音识别和自然语言处理(NLP)中的问题提供了很多效果不错的解决方案。通过这本书您将会知道更多神经网络和深度学习背后的核心概念。


书籍地址:

http://neuralnetworksanddeeplearning.com/


3. Think Bayes


作者:Allen B.Downey


这本书主要介绍了如何使用计算方法处理贝叶斯统计。


如果您想使用本书中的技能来学习其他技能,您需要知道如何编程。


贝叶斯统计是根据数学概念(如微积分)提出的,有关它的大多数书籍也都使用的是数学符号。本书使用Python代码而不是数学,因此“积分”变成了“总和”。这是书中的一个特色。


书籍地址:

http://greenteapress.com/wp/think-bayes/


4. Machine Learning & Big Data


作者:Karee Alkaseer


这本书背后的目的是为了让软件工程师在不依赖库的情况下可以轻松使用机器学习模型。大多数情况下,模型或技术背后的概念很简单、直观,但在细节或行话中会丢失。另外,一般情况下,现有的库可以解决手头的问题,但是有时候它们会用自己的方式抽象和隐藏基本概念,这就是它们被称为“黑盒子”的原因。这本书也尝试着将“黑盒子”里被抽象和隐藏的基本概念清晰化。它是一个还在进行中的作品,它的内容将慢慢的丰富。


书籍地址:

http://www.kareemalkaseer.com/books/ml


5. Satistical Learning with Sparsity:The Lasso and Generalizations


作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright


在过去的十年中,计算和信息技术得到了迅猛发展。随着它的应用,在医学、生物学、金融和市场营销等领域中涌现出了大量的数据。本书在一个共同的概念框架下,阐述了这些领域中的一些重要观点。


书籍地址:

https://web.stanford.edu/~hastie/StatLearnSparsity/


6. Statistical inference for data science


作者:Brian Caffo


作为数据科学专业的一部分 ,本书是统计推理课程(Statistical Inference)的一本配套书籍。如果你没有上这门课,也可以配着YouTube上有关视频单独学习这本书。


本书旨在以低成本介绍统计推理这一重要领域,使得具有编程能力的学生将这些技能用到数据科学或统计学当中去。


书籍地址:

https://leanpub.com/LittleInferenceBook


7. Convex Optimization


作者:Stephen Boyd & Lieven Vandenberghe


这本书的主要内容是关于凸优化(convex optimization),这是一类特殊的数学优化问题,它包括最小二乘和线性规划问题。众所周知,最小二乘和线性规划问题有一个相当完整的理论,出现在各种应用中,并且可以非常有效地用数值求解。本书的基本观点是,对于较大类的凸优化问题也可以如此。


书籍地址:

http://stanford.edu/~boyd/cvxbook/


8. Natural Language Processing with Python


作者:Steven Bird & Ewan Klein & Edward Loper


本书基于Python编程语言和一个叫自然语言工具包(NLTK)的开源库写作而成的。“自然语言”是指用于人类日常交流的语言,与编程语言和数字符号等语言不同,自然语言在代代相传的过程中不断发展,并且很难用明确的规则来确定。为了让计算机更好地理解自然语言,我们开发运用了自然语言处理(NLP)。这本书就是有关自然语言处理(NLP)的书。


书籍地址:

https://www.nltk.org/book/ 


9. Automate the Boring Stuff with Python


作者:AI Sweigart


你是否有过为花费数小时为文件重命名或更新表格里的数百个单元格而烦躁的经历?在这本书中,你将会学到如何使用Python来轻松搞定这些问题。Python十分好上手,一旦掌握了编程的基础知识,就可以创建Python程序,就此轻松解决那些繁琐的事情。


书籍地址:

https://automatetheboringstuff.com/



10.Social Media Mining: An Introduction


作者:Reza  Zafarani & Mohammad Ali Abbasi & Huan Liu


社交媒体在过去十年的发展已经彻底革新了个人互动和行业开展业务的方式。个人通过社交媒体互动、共享产生了大量的数据。


在这本书中,你将了解到社交媒体挖掘(Social Media Mining)整合了社交媒体,社交网络分析和数据挖掘,为学生、从业人员、研究人员等提供了一个方便而一致的平台。同时也将会了解到社交媒体挖掘(Social Media Mining)的潜力。


书籍地址:

http://dmml.asu.edu/smm/


本文由阿里云云栖社区组织翻译。

文章原标题《10 More Free Must-Read Books For Machine Learning and Data Science》

作者:Matthew Mayo

译者:乌拉乌拉,审校:袁虎。


文章为简译,更为详细的内容,点击左下角阅读原文查看。


深度学习12大常见问题解答(附答案)

阿里大咖带你了解技术团队效能动力模型

阿里90后工程师利用ARM硬件特性开启安卓8终端“上帝模式”

从构建分布式秒杀系统聊聊限流特技

更多精彩

点此查看原文!

登录查看更多
2

相关内容

书籍在狭义上的理解是带有文字和图像的纸张的集合。广义的书则是一切传播信息的媒体。
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
机器学习速查手册,135页pdf
专知会员服务
341+阅读 · 2020年3月15日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
213+阅读 · 2020年2月21日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
356+阅读 · 2020年2月15日
421页《机器学习数学基础》最新2019版PDF下载
381页机器学习数学基础PDF下载
专知
88+阅读 · 2018年10月9日
10本必读的机器学习和数据科学免费在线电子书
算法与数据结构
11+阅读 · 2018年6月19日
最全数据科学学习资源:Python、线性代数、机器学习...
人工智能头条
12+阅读 · 2018年5月14日
七本书籍带你打下机器学习和数据科学的数学基础
干货:必读机器学习书籍一览表
专知
7+阅读 · 2018年2月19日
Arxiv
35+阅读 · 2020年1月2日
Arxiv
45+阅读 · 2019年12月20日
Optimization for deep learning: theory and algorithms
Arxiv
104+阅读 · 2019年12月19日
Arxiv
20+阅读 · 2019年11月23日
Generative Adversarial Networks: A Survey and Taxonomy
Arxiv
53+阅读 · 2018年12月11日
A General and Adaptive Robust Loss Function
Arxiv
8+阅读 · 2018年11月5日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
15+阅读 · 2018年6月23日
VIP会员
相关资讯
相关论文
Arxiv
35+阅读 · 2020年1月2日
Arxiv
45+阅读 · 2019年12月20日
Optimization for deep learning: theory and algorithms
Arxiv
104+阅读 · 2019年12月19日
Arxiv
20+阅读 · 2019年11月23日
Generative Adversarial Networks: A Survey and Taxonomy
Arxiv
53+阅读 · 2018年12月11日
A General and Adaptive Robust Loss Function
Arxiv
8+阅读 · 2018年11月5日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
15+阅读 · 2018年6月23日
Top
微信扫码咨询专知VIP会员