统计学习是一套以复杂数据建模和数据理解为目的的工具集,是近期才发展起来的统计学的一个新领域。本书出自统计学习领域声名显赫的几位专家,结合R语言介绍了分析大数据必不可少的工具,提供一些重要的建模和预测技术,并借助丰富的实验来解释如何用R语言实现统计学习方法。论题包括线性回归、分类、重抽样方法、压缩方法、基于树的方法、支持向量机、聚类等,作者借助彩图和实际案例直观解释这些方法。为了读者更好地理解书中内容,每章后还配有丰富的概念性和应用性练习题。
书中内容与《The Elements of Statistical Learning》的大部分内容相同,但是本书起点低,弱化了数学推导的细节,更注重方法的应用,所以更适合作为入门教材。当然,这本《统计学习导论》不仅是优秀的“统计学习”或“机器学习”课程的教材,也是数据挖掘、数据分析等相关从业者不可或缺的参考书。
An Introduction to Statistical Learning with Applications in R 是理工学院大二年级统计科学和数据科学专业的学生的必修课教材。这本书为统计学习领域提供了一个清晰的概览和强有力的工具,帮助读者去认识过去不同领域中涌现出的海量、复杂的数据,并使用先进的统计学习技术来分析和处理这些数据。
书中介绍了一些非常重要的建模和预测技术,以及相关的应用程序,内容涵盖了Statistical Learning, Linear Regression, Classification, Resampling Methods, Linear Model Selection and Regularization, Moving Beyond Linearity, Tree-Based Methods, Support Vector Machines, Unsupervised Learning等。每一章都包含了一个关于如何将各种methods通过R语言来实现分析处理数据的教程。书中有许多彩色的图表和大量真实世界中存在的例子,能够更形象、深刻地阐释相关概念及方法,便于读者学习和理解。
统计学习是指一套用来建模和理解复杂数据集的工具。这是统计学中最近发展起来的一个领域,并与计算机科学(特别是机器学习)的并行发展相结合。该领域包括许多方法,如Lasso和稀疏回归,分类和回归树,以及增强和支持向量机。随着“大数据”问题的爆发,统计学习已经成为许多科学领域以及市场营销、金融等商业学科的一个非常热门的领域。拥有统计学习技能的人非常受欢迎。
作者介绍:
Gareth James 斯坦福大学统计学博士毕业,师从Trevor Hastie。现为南加州大学马歇尔商学院统计学教授,美国统计学会会士,数理统计协会终身会员,新西兰统计协会会员。《Statistica Sinica》、《Applications and Case Studies》、《Theory and Methods》等期刊的副主编。
Daniela Witten 斯坦福大学统计学博士毕业,师从Robert Tibshirani。现为华盛顿大学生物统计学副教授,美国统计学会和国际数理统计协会会士,《Journal of Computational and Graphical Statistics》和《Biometrika》等期刊副主编。
Trevor Hastie 美国统计学家和计算机科学家,斯坦福大学统计学教授,英国皇家统计学会、国际数理统计协会和美国统计学会会士。Hastie参与开发了 R 中的大部分统计建模软件和环境,发明了主曲线和主曲面。
Robert Tibshirani 斯坦福大学统计学教授,国际数理统计协会、美国统计学会和加拿大皇家学会会士,1996年COPSS总统奖得主,提出lasso方法。Hastie和Tibshirani都是统计学习领域的泰山北斗,两人合著《The Elements of Statistical Learning》,还合作讲授斯坦福大学的公开课《统计学习》。