机器学习(ML)是一组用于发现数据关系的编程技术。使用ML算法,您可以对数据进行聚类和分类,以执行建议或欺诈检测之类的任务,并对销售趋势、风险分析和其他预测进行预测。机器学习曾经是学术数据科学家的领域,现在已经成为主流的业务流程,而像易于学习的R编程语言这样的工具将高质量的数据分析交到任何程序员的手中。《使用R、tidyverse和mlr的机器学习》将教会您广泛使用的ML技术,以及如何使用R编程语言及其强大的工具生态系统将它们应用于您自己的数据集。这本书会让你开始!
对这项技术
机器学习技术准确而有效地识别数据中的模式和关系,并使用这些模型对新数据进行预测。ML技术甚至可以在相对较小的数据集上工作,使这些技能成为几乎所有数据分析任务的强大盟友。R语言的设计考虑了数学和统计的应用。小型数据集是它的最佳选择,它的现代数据科学工具(包括流行的tidyverse包)使R成为ML的自然选择。
关于这本书
《使用R、tidyverse和mlr的机器学习》将教会您如何使用强大的R编程语言从数据中获得有价值的见解。作者兼R专家Hefin Ioan Rhys以其引人入胜的、非正式的风格为ML基础知识打下了坚实的基础,并向您介绍了tidyverse,这是一套专门为实用数据科学设计的强大的R工具。有了这些基础知识,您将更深入地研究常用的机器学习技术,包括分类、预测、约简和聚类算法,并将每种技术应用于实际数据,从而对有趣的问题进行预测。
使用tidyverse包,您将转换、清理和绘制您的数据,并在工作中使用数据科学最佳实践。为了简化您的学习过程,您还将使用R的mlr包,这是一个非常灵活的接口,用于各种核心算法,允许您以最少的编码执行复杂的ML任务。您将探索一些基本概念,如过拟合、欠拟合、验证模型性能,以及如何为您的任务选择最佳模型。富有启发性的图片提供了清晰的解释,巩固了你的新知识。
无论您是在处理业务问题、处理研究数据,还是仅仅是一个有数据头脑的开发人员,您都可以通过本实用教程立即构建自己的ML管道!
里面有什么