由一位经验丰富的统计学教育家和两位数据科学家撰写的本书,将传统的统计思维和当代的机器学习框架统一在数据科学的一个总体范畴之下。该书旨在弥合传统统计学与机器学习之间的知识差距。它为具有基本统计背景的读者提供了一种易于理解的方法,以掌握机器学习。本书从第一章中的详细示例和第二章中的精炼优化基础开始,然后介绍常见的监督学习方法,如回归、分类、支持向量机、树算法和范围回归。在讨论了无监督学习方法后,包含一章关于无监督学习的内容以及一章关于从多个资源中连续或同时获取数据的统计学习。本书的一个显著特点是全面覆盖统计学习和医疗应用中的主题。它总结了作者在教学、研究和咨询过程中使用数据分析的经验。书中的示例和配套材料着重于理解数据分析、提供准确的解释以及发现与各种方法相关的隐藏假设。主要特点:- 将传统的基于模型的框架和当代的数据驱动方法统一在数据科学的总体范畴之下。- 包括在高血压、中风、糖尿病、溶栓治疗、阿司匹林疗效等方面的实际医疗应用。- 将统计理论与机器学习算法相结合。- 包括数据科学中潜在的方法学发展。关于作者:John T. Chen 是博林格林州立大学的统计学教授。他在悉尼大学(澳大利亚)获得统计学博士学位后,在麦克马斯特大学(加拿大)完成了博士后培训。John 在《Biometrika》等统计学期刊以及《神经病学年鉴》等医学期刊上发表过研究论文。Clement Lee 是纽约一家私人公司的数据科学家。他从普林斯顿大学计算机科学专业毕业后,在纽约大学获得应用数学硕士学位。Clement 喜欢和他心爱的妻子 Belinda 以及他们的儿子 Pascal 共度时光。Lincy Y. Chen 是摩根大通公司的数据科学家。她毕业于康奈尔大学,并获得了爱德华·M·斯奈德统计学奖。Lincy 发表过关于机器学习方法改进的论文。