七本书籍带你打下机器学习和数据科学的数学基础

2018 年 4 月 22 日 云栖社区

云栖君导读: 本文主要介绍七本关于机器学习和数据科学数学基础的经典教材,是一份不可多得的书单整理。


大多数人学习数据科学的重心放在编程上面,然而,要真正精通数据科学的话是不能够忽视数据科学背后的数据基础。本篇文章,将分享给读者我喜欢的七本有关于数据科学基础的书,下面将逐一为大家介绍这七本数学基础书,请大家开始“享受”吧!


首先要明确一点,我们为什么要为学习数据科学的数学基础而努力呢?以下是激励我的原因:


  • 人工智能正在快速的改变着世界。Geoffrey Hinton大牛使得我们重新对BP算法有了新的思考。

  • 理解背后的数学原理会帮助你更好地理解人工智能的变革。它将帮助你从深度上理解人工智能,与那些浅尝辄止的研究者区分开来。

  • 它还将帮助你更好地了解人工智能知识产权(IP)的潜力。

  • 最后,理解数据科学背后的数学知识也能引导你进入人工智能和数据科学更高端的工作。



一、统计学习理论的本质(The Nature Of Statistical Learning Theory)——Vladimir Vapnik


在数学界中,如果你想创建一个关于数学书的列表并不包括伟大的俄国数学家,那是不可能的。所以,在本文列表中的第一本书籍自然而然就是由Vladimir Vapnik编写的统计学习理论。该书是七本书中最难找到的一本,当然,在中国这都不是事儿。Vladimir Vapnik也是支持向量机(SVM)算法的创造者,其维基百科页面上介绍了很多关于他的工作。


阅读地址:https://www.amazon.com/Nature-Statistical-Learning-Theory/dp/8132202597/ref=redir_mobile_desktop


二、模式分类(Pattern Classification)——Richard O Duda


类似于Vladimir Vapnik的书,Duda是另一个时代的经典书籍。首次发表于1973年,在25年后(2000年)得到更新,之后再也没有进行更新,但这并不妨碍本书成为一本重要的书籍。该书采用模式识别的方法,并涵盖了大量的算法。


阅读地址:https://www.amazon.co.uk/dp/B01N9M71LT/ref=cm_sw_r_em_apa_WdJVAb3037FVR

三、机器学习:算法透视(Machine Learning: An Algorithmic Perspective, Second Edition (Chapman & Hall/Crc Machine Learning & Pattern Recognition))——Stephen Marsland


此书现在有第二版,这本书也是我读过最早的书籍之一。第一版和第二版都很好,其中第二版有更多的Python代码。与前两本书类似,该书也非常强调算法。


阅读地址:https://www.amazon.co.uk/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1466583282/ref=sr_1_1


四、统计学习要素:数据挖掘、推理和预测(The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition)——Trevor Hastie, Robert Tibshirani, Jerome Friedman


又一本经典教材,我使用的版本印刷得非常好,具有很高的参考价值。


阅读地址:https://www.amazon.co.uk/dp/0387848576/ref=cm_sw_r_em_apa_o-aWAbXMMFM4Z


五、模式识别与机器学习(Pattern Recognition and Machine Learning (Information Science and Statistics))——Christopher M. Bishop


Christopher M. Bishop编写的模式识别和机器学习(信息科学和统计学)也是一本深入浅出且非常完善的书籍,参考价值高。


阅读地址:https://www.amazon.co.uk/Pattern-Recognition-Learning-Information-Statistics/dp/0387310738/ref=sr_1_1



六、机器学习:理解数据的算法中的艺术和科学(Machine Learning: The Art and Science of Algorithms that Make Sense of Data)——Peter Flach


我喜欢Peter Flach的书籍,尽管购物网站上的一些评论说其有些冗长并缺少代码,但我喜欢其整本书的布局(算法的分组:逻辑模型、线性模型以及概率模型)和主题的整体处理。


阅读地址:https://www.amazon.co.uk/Machine-Learning-Science-Algorithms-Sense/dp/1107422221/ref=sr_1_1



七、深度学习(Deep Learning)——Goodfellow、Bengio和 Corville


该书也被称作“花书”,内容很详细且知识新,涵盖你能想到的一切知识点。


两个值得推荐的其它资源:


  • 机器学习的第一门课程(A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition))——Simon Rogers、Mark Girolami 
    这本书有第一版和第二版,其中第一版是我得到的第一本书,但我不建议初学者看这本书,但这不妨碍该书是本好书(尤其是第二版)。

  • 机器学习:从概念的角度(Machine Learning: A Probabilistic Perspective )——Kevin Murphy


该书评价很高,但我没有亲自阅读它,因此没有放在列表中。


阅读地址:https://www.amazon.co.uk/Deep-Learning-Adaptive-Computation-Machine/dp/0262035618/ref=sr_1_1


总结


除了“花书”以外,我不会推荐从头到尾的阅读。我偏爱于按照主题阅读书籍,即将其作为参考书,当需要清楚哪部分内容时阅读相应的内容。通过阅读以上这些书籍使我觉得自己很谦卑,知道的很少,而机器学习和数据科学领域是多么的广阔。


书籍是永恒的,也是不会抛弃自己的朋友,一直在那里等着你去相遇、相识。Vladimir Vapnik现在已经81岁高龄,Duda这本书首次出版与1973年,我估计50年后,这个行业的从业者仍将阅读它们,就像经受住时间考验的老朋友一样。这展示了基于数学方法的寿命,永不褪色和凋零!


作者信息


Ajit Jaokar,数据科学家、教师

本文由阿里云云栖社区组织翻译。


文章原标题《7 Books to Grasp Mathematical Foundations of Data Science and Machine Learning》,译者:海棠,审校:Uncle_LLD。





点击“阅读原文”了解书籍详情!
登录查看更多
26

相关内容

Vladimir Vapnik 被称为统计学习理论之父,他出生于俄罗斯,1990 年底移居美国,在美国贝尔实验室一直工作到 2002 年,之后加入了普林斯顿的 NEC 实验室机器学习研究组,同时任哥伦比亚大学特聘教授。2006 年,Vladimir 称为美国工程院院士。2014年 Vladimir Vapnik 加入 Facebook 人工智能实验室。Vladimir Vapnik 在机器学习上有很多奠基之作,例如 Vapnik–Chervonenkis 理论,Vladimir 是主要发明者。 https://en.wikipedia.org/wiki/Vladimir_Vapnik https://scholar.google.com/citations?user=vtegaJgAAAAJ&hl=en
机器学习速查手册,135页pdf
专知会员服务
338+阅读 · 2020年3月15日
台湾大学林轩田机器学习书籍《从数据中学习》,216页pdf
【电子书】机器学习实战(Machine Learning in Action),附PDF
专知会员服务
126+阅读 · 2019年11月25日
【资源】机器学习数学全书,1900页PDF下载
全球人工智能
152+阅读 · 2019年10月17日
五个给机器学习和数据科学入门者的学习建议
机器之心
3+阅读 · 2019年9月16日
421页《机器学习数学基础》最新2019版PDF下载
100页机器学习入门完整版,初学者必备!
专知
25+阅读 · 2018年12月18日
7本最佳深度学习书籍,总有一本适合你
人工智能头条
6+阅读 · 2018年3月9日
干货:必读机器学习书籍一览表
专知
7+阅读 · 2018年2月19日
机器学习知识体系
架构文摘
19+阅读 · 2018年1月7日
荐书丨机器学习——Python实践(留言送书)
程序人生
7+阅读 · 2018年1月5日
【推荐】免费书(草稿):数据科学的数学基础
机器学习研究会
20+阅读 · 2017年10月1日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
3+阅读 · 2018年6月24日
Arxiv
6+阅读 · 2018年3月29日
Arxiv
10+阅读 · 2017年12月29日
VIP会员
相关资讯
【资源】机器学习数学全书,1900页PDF下载
全球人工智能
152+阅读 · 2019年10月17日
五个给机器学习和数据科学入门者的学习建议
机器之心
3+阅读 · 2019年9月16日
421页《机器学习数学基础》最新2019版PDF下载
100页机器学习入门完整版,初学者必备!
专知
25+阅读 · 2018年12月18日
7本最佳深度学习书籍,总有一本适合你
人工智能头条
6+阅读 · 2018年3月9日
干货:必读机器学习书籍一览表
专知
7+阅读 · 2018年2月19日
机器学习知识体系
架构文摘
19+阅读 · 2018年1月7日
荐书丨机器学习——Python实践(留言送书)
程序人生
7+阅读 · 2018年1月5日
【推荐】免费书(草稿):数据科学的数学基础
机器学习研究会
20+阅读 · 2017年10月1日
Top
微信扫码咨询专知VIP会员