程序员书库(ID:OpenSourceTop) 编译
链接:https://www.kdnuggets.com/2018/05/10-more-free-must-read-books-for-machine-learning-and-data-science.html
KDnuggets 网站编辑 Matthew Mayo 挑选了 20 本机器学习和数据科学相关的书籍。是时候让你的书架上新增几本机器学习和数据科学书籍了,最重要的是这些书籍全部有免费的电子版!!!
1. 《Python 数据科学手册》
本书介绍了在Python中处理数据所必需的核心库:特别是IPython,NumPy,Pandas,Matplotlib,Scikit-Learn和相关软件包。读这本书,你需要有Python基础,如果你没有Python基础可以先读《A Whirlwind Tour of Python》这本书是针对Python语言快速入门的书
书籍链接:https://github.com/jakevdp/PythonDataScienceHandbook
2. 《Neural Networks and Deep Learning》
是一本免费的在线书籍。这本书主要概述两大核心概念:
● 神经网络,一个编程范例,使计算机可以从观测数据中学习
● 深度学习,这是一套强大的神经网络学习技术
神经网络和深度学习目前为图像识别,语音识别和自然语言处理中的许多问题提供了最佳解决方案。本书将教授许多神经网络和深度学习背后的核心概念。
书籍链接:http://neuralnetworksanddeeplearning.com/
3. 《贝叶斯思维》
think X系列的书籍之一,大多数讲贝叶斯统计的书,都是用数学符号,以数学概念(如微积分)为基础展开的,此书则用Python代码代替数学符号,用离散数学代替连续数学。这样一来,数学里的积分变成了求和,概率分布的运算大多成了简单的循环。
书籍链接:http://greenteapress.com/wp/think-bayes/
4. 《Machine Learning & Big Data》
这本书目前算是一部还没完结的作品,其目的是为了让软件工程师可以在不依赖库的情况下就能轻松构建机器学习模型,从而在理论和实践中获得平衡,大多数情况下,模型背后的概念或技术都很简单或者说比较直观,但是细节和术语上就容易出问题。
另外,现有的库基本可以解决现有的问题。更多的时候它们有自己的抽象和架构来隐藏底层概念。本书的目的就是为了让基本概念更清晰。
书籍链接:http://www.kareemalkaseer.com/books/ml
5. 《Statistical Learning with Sparsity》
在过去的十年中,计算和信息技术出现了爆炸性增长。随着它在各种领域如医学,生物学,金融和市场营销中涌现出大量的数据。本书在一个通用的概念框架中阐述了这些领域重要的数据科学思想。
书籍链接:https://web.stanford.edu/~hastie/StatLearnSparsity/
6. 《Statistical inference for data science》
本书是作为数据科学专业领域的书籍,也是一部有关推论统计学的 Coursera配套书。值得一提的是,这本书有配套的Coursera课程视频,可以在YouTube上找到。
本书旨在作为推论统计学的入门书籍。目标受众是具有数学和计算机编程基础的学生,他们希望将这些技能用于数据科学或统计学。这本书是免费提供的。
书籍链接:https://leanpub.com/LittleInferenceBook
7. 《凸优化》
这是一本关于凸优化的书,凸优化是一类特殊的数学优化问题,它包括最小二乘法和线性规划问题。众所周知,最小二乘法和线性规划问题具有相当完善的理论,出现在各种应用中,并且这些问题可以用编程来解决。这本书主要是面向实际应用,丰富的案例是本书的特色
书籍链接:http://stanford.edu/~boyd/cvxbook/
8. 《Python 自然语言处理 》
这是一本关于自然语言处理的书。“自然语言”是指用于人类日常交流的语言,如英语,印地语或葡萄牙语等语言。与诸如编程语言和数学符号这样的人造语言相比,自然语言在代代相传的过程中不断发展,并且很难用明确的规则来确定。我们将在广义上采用自然语言处理(或简称NLP)来表示计算机对自然各种不同的自然语言的理解...
本书基于Python编程语言和一个自然语言工具包(NLTK)的开源库。
书籍链接:https://automatetheboringstuff.com/https://www.nltk.org/book/
9. 《Python 编程快速上手》
如果您曾花费数小时重命名文件或更新数百个电子表格单元格,你就能体会这些工作是多么的乏味。但是如果你可以让你的电脑帮你做这些事,那感觉就不一样了
看完这本书,你可以通过编写Python程序,可以让计算机自动完成它们,本书适合任何想要通过Python学习编程的读者,尤其适合缺乏编程基础的初学者。
书籍链接:https://automatetheboringstuff.com/
10. 《社会媒体挖掘》
社交媒体在过去十年的发展已经彻底改变了人们的交流方式和行业开展业务的方式。个人通过社交媒体互动,共享和内容消费并以前所未有速度产生大量的数据。
本书集成了近年来社会媒体、社会网络分析以及数据挖掘的前沿成果,为学生、从业者、研究人员和项目经理提供了一个方便的平台,以便理解社会媒体挖掘的基础知识和潜能。本书介绍了社会媒体数据的问题,并阐述了网络分析和数据挖掘的基本概念、新问题以及有效的算法。
书籍链接:http://dmml.asu.edu/smm/
●输入m获取到文章目录