属性图是对现实系统建模的有力工具,它存在于社会科学、生物学、电子商务等许多领域。这些系统的行为大多由它们对应的网络结构定义或依赖于它们。由于这些系统迅速融入到人类生活的各个方面,以及它们对人类行为的深刻影响,图分析已经成为一个重要的研究方向。图结构数据包含了来自网络连通性和节点补充输入特征的丰富信息。机器学习算法或传统的网络科学工具在同时利用网络拓扑和节点特征方面存在局限性。图神经网络(GNNs)提供了一个有效的框架,将两种信息源结合起来,为包括节点分类、链接预测等在内的广泛任务产生精确的预测。
图数据集的指数增长推动了复杂GNN模型的发展,引起了对处理时间和结果可解释性的关注。另一个问题来自于收集大量带注释的数据来训练深度学习GNN模型的成本和局限性。除了采样问题外,数据中异常实体的存在可能会降低拟合模型的质量。在本文中,我们提出了新的技术和策略来克服上述挑战。首先,我们提出了一种适用于简单图卷积(SGC)的灵活正则化方案。该框架在呈现稀疏拟合参数向量集的同时,继承了SGC快速高效的特性,有利于识别重要的输入特征。其次,我们研究收集训练样本的有效程序,并制定指示性措施及量化指引,以协助从业员选择最佳抽样策略以获取数据。然后对现有的GNN模型进行改进,以完成异常检测任务。该框架具有较好的准确性和可靠性。最后,我们尝试将灵活的正则化机制应用于链接预测任务。