由于现实世界中的对象及其交互往往是多模态和多类型的,异质网络已经成为现实作为传统同构网络(图)的一个更强大、更真实、更通用的超类而广泛使用。与此同时, 表示学习(又称嵌入)最近不仅有了新的深入的研究,而且在各种网络挖掘和分析任务中显示出了其有效性。在这项研究中,我们旨在提供一个统一的框架,来对现有的研究异质网络嵌入(HNE)进行深入总结和评价,同时包括但不限于一般的综述。既然HNE算法已经有了广泛的基础,关于这项研究的第一个贡献就是,我们为系统分类提供了一个通用范式,以此来分析现有HNE算法的优点。此外,尽管大多数人声称现有的HNE算法是通用的,但实际上大多时候它只会在不同的数据集上进行评估。可以理解的是,由于HNE的应用优势,这种间接的比较很大程度上阻碍了适当地将任务性能的提高归因于有效的数据预处理和新颖的技术设计,尤其是考虑到从真实应用数据构建异质网络的各种可能方法。因此,作为这项研究中的第二贡献是,我们创建了四个基准数据集,它们具有关于规模、结构、属性/标签可用性等,以便于更加公平地评估HNE算法。此外,在这项研究工作中的第三个贡献是,我们认真地对13种常用HNE算法的实现方式进行了改进和重构,同时还为它们创建了友好的接口,并对其进行了全面的比较通过多项任务和实验设置。通过将现有的HNE算法置于统一的框架下,我们的目标是提供一个通用的参考和指导来了解和发展HNE算法。同时,通过开放所有的数据和代码,我们设想能提供一个可用的基准平台来测试和比较现有和未来HNE算法的性能,从而服务于社区。
https://www.zhuanzhi.ai/paper/ed00f46565968c403d873f61c3021d9d