数据无处不在,且其增长速度前所未有。然而,理解这些数据是一项挑战。数据挖掘是从大型数据集中发现模式和知识的过程,而使用Python进行数据挖掘则专注于通过实践学习数据挖掘的方法。本书展示了如何使用Python的各种包来完成数据挖掘的整个流程,包括收集、集成、操作、清理、处理、组织和分析数据以获取知识。 内容是基于数据挖掘的流程组织的,因此读者可以一步一步地自然地推进整个过程。主题、方法和工具通过三个方面进行解释:“它是什么”作为理论背景,“为什么我们需要它”作为应用导向,以及“我们如何做”作为案例研究。 本书旨在为学生、数据科学家和业务分析师提供一种实用的方式来理解数据挖掘的概念。通过可运行、可修改的互动教程,这本书将帮助读者获得实践技能,将数据挖掘技术应用于实际工作中。 关于作者 吴迪博士是雷曼学院商学院金融、信息系统与经济学系的助理教授。他在纽约市立大学研究生中心获得了计算机科学博士学位。吴博士的研究兴趣包括:1)RDF和语义网的时间扩展,2)应用数据科学,3)商业教育中的体验式学习与教学法。吴博士开发并教授了包括战略管理、数据库、商业统计、管理决策、编程语言(C++、Java和Python)、数据结构与算法、数据挖掘、大数据和机器学习等课程。