数据科学:初级介绍侧重于使用R编程语言在Jupyter笔记本中进行数据操作和清理,创建有效的可视化图表,以及利用分类、回归、聚类和推理从数据中提取见解。 该文本强调了清晰、可重现和可分享的工作流程,并包括了基本的版本控制基础知识。所有源代码都可以在线获得,演示了良好的可重现项目工作流程的应用。 基于教育研究和积极学习原则,本书采用了现代的R方法,并包括附带的自动分级的Jupyter工作表,用于互动、自主学习。本书将使读者在数据科学项目方面有很好的准备。 本书适用于各个学科领域的学习者,他们对数学和编程的先前知识很少。作者通过多年来在不列颠哥伦比亚大学的DSCI100:数据科学入门课程中教授数千名本科生的经验来完善了教材。