作者:Trung Nguyen
翻译:王雨桐
校对:张一豪
本文约1000字,建议阅读5分钟。
本文将分理论部分和实际部分为你推荐一些机器学习和数据科学的相关书籍。
公众号主界面回复‘14’获取本文推荐书籍下载链接
理论部分
以下都是机器学习的基础教材。如果你认真研读其中任意一本,这意味着你要分析其中的模型,推导和实现主推理算法并进行练习,这些教材可以为你提供坚实的背景。如果你是机器学习的入门菜鸟,这些书可能技术性很强,但是一旦你坚持完成其中一本,你会发现其他教材也变得简单易懂。
1. 统计学习精要(The Elements of Statistical Learning (ESL))
作者:Jerome H. Friedman, Robert Tibshirani, and Trevor Hastie
推荐语:经典之作!!这同时也是一个在线课程,新版教材提供R代码
2. 模式识别与机器学习(Pattern recognition and machine learning (PRML))
作者:Christopher Bishop
推荐语:和ESL一样,这本也是必读之作。
3. 机器学习:概率学观点(Machine Learning: A Probabilistic Perspective)
作者:Kevin R Murphy
推荐语:如果你彻底学习(前文)PRML,你能掌握这本书中的大部分内容。 然而,这是一本有趣而全面的书,主要关注有原则的、概率性的建模方法。 它还附带Matlab中的代码。
4. 概率图模型(Probabilistic Graphical Models)
作者:Daphne Koller and Nir Friedman
推荐语:图模型为概率模型的表示、推理以及学习提供了框架。这个强大的框架为许多机器学习模型提供了宏观视角,否则这些模型仅仅被看作一堆不同的模型。书还配有Coursera的在线课程。
5. 强化学习(Reinforcement learning, an introduction)
作者:Richard S. Sutto and Andrew G. Barto
推荐语:尽管这本书还是一个初稿,但第二个版本已经写得很好,并且很好地解释了强化学习的概念和应用。
6. 神经网络与深度学习(Neural networks and deep learning)
作者:Michael Nielsen
推荐语:Michael Nielsen的书更加实用,包含一些很酷的互动内容以帮助理解
7. 深度学习(Deep Learning)
作者:Ian Goodfellow and Yoshua Bengio and Aaron Courville
推荐语:相比上面Michael Nielsen书的实用性,本书则更全面。我建议按照给定的顺序阅读学习。
应用部分
1. 商业中的数据科学(Data science for business)
作者:Foster Provost and Tom Fawcett
推荐语:本书对非技术人员(如业务经理)非常友好。它还提供了有关如何执行数据科学项目的一些合理原则。强烈推荐此书!!
2. R数据科学(R for data science)
作者:Garrett Grolemund and Hadley Wickham
推荐语:特别是对R用户来说,这本是必读教材。
3. 应用预测建模(Applied predictive modelling)
作者:Kjell Johnson and Max Kuhn
推荐语:由非常流行的R包caret的作者撰写,也是一本必读教材。 它包含许多实用技巧和建议,不仅可用于建模,还可用于不同模型的数据准备。
4. 数据科学技术:市场营销、销售与客户关系管理领域(Mining Techniques: For Marketing, Sales, and Customer Relationship)
作者:Gordon S. Linoff and Michael J. A. Berry
推荐语:不要被标题误导,书中的数据科学技术普遍适用,不仅仅是对客户关系管理(CRM)。
5. 数据挖掘的数据准备(Data preparation for data mining)
作者:Dorian Pyle
推荐语:1999年出版,但今天仍然非常适用,本书提供了一个明细的清单,以便在准备分析数据时进行检查。
6. 网站优化的Bandit 算法(Bandit algorithms for website optimization)
作者:John Myles White
推荐语:本书介绍了标准的多臂赌博机算法(multi-armed bandit),并提供了多种语言的实现。
7. R数据科学实战手册(Practical data science with R)
作者:John Mount and Nina Zumel
推荐语:此书不像Johnson和Kuhn的书那样精致,但还是有一些值得了解的技巧。
公众号主界面回复‘14’获取本文推荐书籍下载链接
原文标题:
Data science books - theory and practice
原文链接:
https://www.codementor.io/trungnguyen958/data-science-books-theory-and-practice-krrjgncy7
译者简介
王雨桐,统计学在读,数据科学硕士预备,跑步不停,弹琴不止。梦想把数据可视化当作艺术,目前日常是摸着下巴看机器学习。
翻译组招募信息
工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。
你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。
其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。
点击文末“阅读原文”加入数据派团队~
点击“阅读原文”拥抱组织