你的暑假可能还没到,但机器学习的假期书单已经提前出炉了。
想到假期还可以好好学习,是不是一下子就有动力复习了呢?
作者 Jake VanderPlas
这本书介绍了一些核心库,用Python处理数据的时候,就能感受到它们的珍贵。
具体来说,就是IPython, Numpy, Pandas, Matplotlib, Scikit-Learn,以及相关的软件包。
啃食此书之前,需熟悉Python语言。如需要这门语言的迅速入门之径,请选用A Whirlwind Tour of Python (Python旋风之旅) 。而这也不是小白友好的选择,只是为计算机相关研究人员准备的快速入门。
传送门:
https://jakevdp.github.io/PythonDataScienceHandbook/
作者 Michael Nielsen
这本在线书,分为两个部分——
· 神经网络,一种唯美的、从万物生长中汲取灵感的编程范式,让计算机能够从数据中学习。
· 深度学习,一系列强有力的技术,让神经网络壮大起来。
神经网络加深度学习,可以给许多问题找到更好的解决方案,在图像识别、语音识别以及自然语言处理中,皆有用武之地。
此书涵盖的是,大量的核心概念。
传送门:
http://neuralnetworksanddeeplearning.com/
作者 Allen B.Downey
这本书讲的是,怎样用计算方法处理贝叶斯统计。
作为Think X系列的一员,此书的思路是,如果你会编程,就可以用这项技能来学习其他科目了。
大多数讲贝叶斯统计的书,用的都是数学符号,也是以数学概念为脉络走的。
此书则用Python代码代替数学符号,用离散近似代替连续数学。
于是,数学里的积分变成了求和,概率分布的运算大多成了简单的环。
中文版已出版,资源自寻,以下为英文版地址。
传送门:
http://greenteapress.com/wp/think-bayes/
作者 Kareem Alkaseer
这是一部没有完成的作品,随着时间推移内容也慢慢丰盈。
背后的想法是,在理论和实践之间获得平衡,让软件工程师可以轻松使用模型,又不用太依赖库。
大多数情况下,模型背后的概念或技术都比较简单直观,但是细节和术语上就容易出问题。
另外,现有的库通常都可以解决手边的问题。但它们大多还是有自己的抽象方法和结构,把基本概念藏在背后了。
这本书的存在,就是想要把那些隐藏的概念厘清。
传送门:
http://www.kareemalkaseer.com/books/ml
作者 Trevor Hastie, Robert Tibshirani, Martin Wainwright
在过去的十年里,计算和信息技术呈现爆炸式增长。随之,医疗、生物、金融、时常等等领域都有了大大大量的数据。
这部作品,在一个通用的概念框架之下,描述了一些统计学和数据科学的重要观点。
传送门:
https://web.stanford.edu/~hastie/StatLearnSparsity/
作者 Brian Caffo
本书是Coursera课程Statistical Inference (推论统计学) 的配套书,也是Data Science专项课程的一部分。
不过,就算不上课,也可以学这本书。Coursera课程视频可以在油管上找到,搭配食用疗效更佳。
此书是推论统计学的入门之书,面向的主要是有编程能力的学生,帮他们把这样的能力用到数据科学或者统计学中。
传送门:
https://leanpub.com/LittleInferenceBook/read
作者 Stephen Boyd, Lieven Vandenberghe
凸优化,是一类特殊的数学优化问题,最小二乘法和线性规划也属于这个类别。
最小二乘法和线性规划问题拥有非常完善的理论,可以用编程来轻松解决。
而这本书要说的是,凸优化中包含了更宽广的一类问题,但也依然可以用编程碾压。
传送门:
http://stanford.edu/~boyd/cvxbook/
作者 Steven Bird, Ewan Klein, Edward Loper
这是一本关于自然语言处理 (NLP) 的书,英语、汉语等人类使用的语言都是系统处理的对象。
与编程语言不同,自然语言在代代相传的过程中发生演变,很难用明确的规则来解析其中的含义。
不过,人类还是要让计算机去理解自然语言。这本书,是基于Python以及一个名为自然语言工具包 (NLTK) 的开源库,写成的。
英文版传送门:
https://www.nltk.org/book/
中文版传送门:
https://blog.csdn.net/feng98ren/article/details/79400377
作者 Al Sweigart
你有没有花好几个小时给文件重命名、或者更新表格里的几百个单元格的经历?
这么痛苦的重复工作,还是交给电脑比较好。
跟着这本书,可以学到怎样用Python写程序来代替你完成那些繁复的操作。
新手友好,无需经验。
传送门:
https://automatetheboringstuff.com/
作者 Reza Zafarani, Mohammad Ali Abbasi, Huan Liu
过去10年里,社交媒体的发展革新了人们互相交流的方式,以及各行各业开展业务的方式。
在社交媒体上,通过互动、分享以及内容消费,每个个体都在以前所未有的速度产生数据。
理解并处理这类新的数据,从而搜集可用的规律——这给跨学科研究、新算法以及工具的开发,带来了机遇和挑战。
此书整合了社交媒体、社交网络分析以及数据挖掘的相关内容,为学生、数据从业者和研究人员提供一个平台,来初步了解社交媒体挖掘,以及它潜在的可能性。
中文版已出版,资源自寻,以下为英文版地址。
传送门:
http://dmml.asu.edu/smm/SMM.pdf
虽然,还有几十天才到暑假,不过放了假也要好好学习哟,毕竟开学之后还要补考嘛。
如果十本太少的话,可以前往以下地址,还有十本书供您继续沉迷:
https://www.kdnuggets.com/2017/04/10-free-must-read-books-machine-learning-data-science.html
— 完 —
活动报名
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态