行业、学术界和政府对熟练数据科学从业者的需求正在迅速增长。这本书介绍的概念和技能,可以帮助你解决现实世界的数据分析挑战。它涵盖了概率、统计推断、线性回归和机器学习的概念。它还可以帮助你开发R编程、dplyr数据处理、ggplot2数据可视化、用插入符号构建算法、用UNIX/Linux shell组织文件、用Git和GitHub控制版本、用knitr和R markdown编写可复制的文档。这本书分为六个部分: R,数据可视化,数据争论,概率,推理和回归与R,机器学习和生产力工具。每一部分有几个章节,作为一个讲座。这本书包括几十个练习分布在大多数章节。