随着数字技术的快速成熟和稳定,我们正在被无数的数字实体、连接设备和微服务轰炸。它们有目的地相互作用,以创建庞大的多结构数字数据集。挑战在于如何将数据转化为信息和知识。有大量的数据分析方法。随着产品和工具供应商的不断贡献,数据分析的步伐正在获得急需的速度和智慧。数据科学是一个日益与数据分析相关的领域。有大的、快速的、流式的数据分析平台、框架、加速器、工具包等,使数据分析更简单、更快、更实惠。
在大数据世界中,NoSQL和分布式SQL数据库迅速获得了市场和脑力份额。图数据库是一种突出的NoSQL数据库。通过图表的数据表示为可视化和实现一系列新功能奠定了令人振奋的基础。另一方面,通过人工智能(AI)算法[机器和深度学习(ML/DL)]更快的成熟度和稳定性,分析能力得到了显著提高。因此,通过直接和独特的AI算法授权,经典和当前的数据科学范式得到了实质性的进步,拥有了复杂的能力。现在情况有了转机。将受人工智能启发的数据科学方法应用于图结构数据被视为数字世界的一个明确的游戏规则改变者。通过数据科学平台、框架和引擎从数据堆中提取隐藏的模式、有用的关联、迫在眉睫的风险、未来的机会和其他有用和可用的见解是新的常态。特别是图数据的数据科学正获得特殊的意义,因为人们已经充分认识到,图和数据科学技术的结合可以带来许多值得注意的创新和转变。
图数据科学是从图表示的数据中发现知识的一种技术驱动的方法。专家指出,图数据科学具有带来一系列业务、技术和用户用例的内在优势。在这本书中,我们将涵盖图数据科学的各个方面,以及它如何成为数据分析领域的游戏规则改变者。这本书的主要章节是:
图技术——本章涵盖了图理论的概念,为更好地理解图分析技术和工具建立一个强大和可持续的基础。讨论了不同类型的图,以及发生在图技术领域的最新趋势和转变。描述图算法——在理解了图算法和分析的重要性之后,研究人员和专家提出了许多特定于图的算法,这些算法使图分析成为可能。本章介绍了有前途和突出的图算法,如社区检测,检测组聚类或分区选项;中心性(重要性),用于确定网络中不同节点的重要性;相似度用来评估节点的相似程度;启发式链接预测,估计节点形成关系的可能性;寻路和搜索,寻找最优路径并评估路径的可用性和质量。介绍图分析——正在研究各种收集和清理的数据,以从数据中推断出隐藏的见解。由于传统的数据分析方法无法从数据中获得更深入和决定性的洞见,图分析越来越受关注。图分析(也称为网络分析)是对客户、产品、解决方案、服务、运营和设备等实体之间关系的分析。本章重点讨论增强图分析的有前景和潜在的技术。图数据库和工具包——图数据库是一种数据库,它将数据之间的关系视为与数据本身同等重要。它们用于执行高级图分析,方法是连接节点并以用户可以查询的图的形式创建关系(边)。本章将介绍主流图数据库,以及它们如何简化下一代图分析。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DGDS” 就可以获取《【干货书】图数据科学:图算法,分析方法,平台,数据库,和用例,415页pdf》专知下载链接