https://www.manning.com/books/graph-powered-machine-learning
机器学习的核心是有效地识别数据中的模式和关系。许多任务,例如查找词汇之间的关联以便您能够做出准确的搜索建议,或者在社交网络中定位具有相似兴趣的个人,很自然地以图Graph的形式表达出来。图驱动机器学习教你如何使用基于图形的算法和数据组织策略来开发高级的机器学习应用程序。
对这项技术
对于任何涉及到大型数据集中的模式匹配的任务,基于图的机器学习都是一个非常强大的工具。应用程序包括安全问题,如识别欺诈或检测网络入侵,应用程序领域,如社交网络或自然语言处理,以及更好的用户体验,通过准确的推荐和智能搜索。通过将数据组织和分析为图形,您的应用程序可以更流畅地使用以图形为中心的算法(如最近邻算法或页面排名算法),在这些算法中,快速识别和利用相关关系非常重要。现代图形数据存储(如Neo4j或Amazon Neptune)是支持图形机器学习的现成工具。
关于这本书
图驱动机器学习向您介绍图技术概念,强调图在机器学习和大数据平台中的作用。您将深入了解各种技术,包括数据源建模、算法设计、链接分析、分类和集群。在掌握核心概念之后,您将探索三个端到端项目,它们将演示体系结构、最佳设计实践、优化方法和常见缺陷。作者亚历山德罗·内格罗在构建基于图形的机器学习系统方面的丰富经验在每一章中都有所体现,你可以从他与真实客户合作的实例和具体场景中学习!
里面有什么
机器学习项目的生命周期 端到端应用程序 大数据平台中的图形 数据源建模 自然语言处理、推荐和相关搜索 优化方法
本书组织
这本书分为四部分,共12章。第一部分介绍了书中的主要主题,从通用机器学习和图的概念开始,然后转移到将这些概念结合起来的好处:
第一章介绍了机器学习和图,涵盖了理解以下章节所必需的基本概念。
第二章列举了将大数据作为机器学习输入的主要挑战,并讨论了如何使用图模型和图数据库来处理这些挑战。介绍了图形数据库的主要特点。
第三章详细描述了图在机器学习工作流中的作用,并描述了一个用于大规模图处理的系统。
第2部分讨论了几个实际用例,在这些用例中,图形支持了机器学习项目的开发,并改进了最终的结果,特别关注以下:
第四章介绍了最常见的推荐技术,并描述了如何为其中之一设计合适的图模型:基于内容的推荐引擎。它详细展示了如何将现有(非图)数据集导入到图模型中,并实现基于内容的工作推荐引擎。
第五章描述了如何为协同过滤方法设计合适的图模型,以及如何实现充分工作的协同过滤推荐引擎。
第六章介绍了基于会话的推荐算法,并描述了一个能够捕获用户会话数据的图模型。它演示了如何将示例数据集导入到设计的模型中,并在其上实现一个真正的推荐引擎。
第七章通过一个考虑用户上下文的推荐引擎的实现来驱动读者。它描述了上下文感知推荐引擎的图模型,并展示了如何将现有数据集导入到图模型中。此外,本章还说明了如何在单个引擎中组合多种推荐方法。
第三部分讨论了欺诈检测:
第八章介绍了欺诈检测,并描述了不同领域的不同类型的欺诈。它还规定了图形在建模数据中的作用,以便更快更容易地揭示欺诈,以及一些用于打击欺诈的简单图形模型中的技术和算法。
第九章转向基于异常检测的更高级的打击欺诈的算法。它展示了如何使用图来存储和分析事务的k-NN,并识别异常事务。
第十章描述了如何使用社会网络分析(SNA)对欺诈者和欺诈风险进行分类。它列出了基于SNA的欺诈分析的不同图表算法,并展示了如何从数据中得出正确的图表。
第四部分介绍了自然语言处理(NLP):
第十一章介绍了基于图的自然语言处理的相关概念。特别地,它描述了一种通过NLP提取非结构化数据的隐藏结构来分解文本并将其存储到图中的简单方法。
第十二章介绍了知识图谱,详细描述了如何从文本中提取实体和关系,并从中创建知识图谱。它列出了知识图谱使用的后处理技术,如语义网络构建和自动主题抽取。