《数据挖掘:概念和技术》(第4版)介绍了从不同应用的各种数据中挖掘模式、知识和模型的概念、原则和方法。具体来说,它深入研究了从大量数据集合中发现模式和知识的过程,称为从数据中知识发现(knowledge discovery from data, KDD)。重点讨论了数据挖掘技术在大数据集上的可行性、有用性、有效性和可扩展性。在介绍了数据挖掘的概念之后,作者解释了数据预处理、特征化和数据仓库的方法。然后将数据挖掘方法划分为几个主要任务,介绍了挖掘大数据集频繁模式、关联和相关性的概念和方法;数据分类与模型构建;聚类分析;以及异常值检测。将深度学习的概念和方法作为一章进行系统介绍。最后,本书涵盖了数据挖掘的趋势、应用和研究前沿。
介绍深度学习的一个全面的新章节,包括改进深度学习模型的训练,卷积神经网络,循环神经网络和图神经网络 * 数据挖掘趋势和研究前沿,包括挖掘丰富的数据类型(文本、时空数据和图/网络),数据挖掘应用(如情感分析、真值发现和信息传播),数据挖掘方法和系统,以及数据挖掘与社会 * 提供充分利用数据所需的概念和技术的全面、实用的视图