使用Scikit-Multiflow框架设计、开发和验证带有流数据的机器学习模型。这本书是一个快速入门指南,为数据科学家和机器学习工程师寻求实现机器学习模型流数据与Python产生实时见解。
本书首先介绍流数据、与它相关的各种挑战、它的一些实际业务应用程序和各种窗口技术。然后,您将研究增量学习算法和在线学习算法,以及使用流数据进行模型评估的概念,并将介绍Python中的Scikit-Multiflow框架。接下来回顾了各种变化检测/概念漂移检测算法,以及使用Scikit-Multiflow实现各种数据集。
本书还介绍了流数据的各种有监督和无监督算法,以及它们使用Python在各种数据集上的实现。本书最后简要介绍了其他可用于流媒体数据的开源工具,如Spark、MOA(大规模在线分析)、Kafka等。
你会学习到: 理解流数据的机器学习概念 回顾增量学习和在线学习 开发检测概念漂移的模型 探索流数据上下文中的分类、回归和集成学习技术 应用最佳实践来调试和验证流数据上下文中的机器学习模型 介绍其他处理流数据的开源框架。