图结构无处不在,从电子商务到知识图谱,抽象出个体数据实体之间的交互。运行在图结构数据上的各种实际应用程序需要为图的每个部分——节点、边、子图和整个图——提供有效的表示,以编码其基本特征。近年来,图上的深度学习(Deep Learning on Graphs,DLG)通过学习图表示,在各个领域取得了突破性进展,成功捕捉了图中潜在的归纳偏差。然而,这些突破性的DLG算法在应用于实际场景时,有时会面临一些局限性。首先,由于只要在存在实体交互的领域中都可以构建图,因此实际中的图往往是多样化的。因此,每一个新的应用程序都需要领域专家的参与和繁琐的超参数调优工作,以找到最优的DLG算法。其次,实际中的图的规模不断扩大,甚至达到数十亿节点,同时还伴随着未过滤的噪声。这要求在实现DLG应用之前进行冗余的预处理,例如图采样和噪声过滤。接下来,实际中的图大多是专有的,而许多DLG算法往往假设它们可以完全访问外部图,以学习其分布或提取知识,进而转移到其他图。最后,语言和视觉领域的单模态基础模型的出现,促进了多种模态的集成,导致了带有多种模态的节点和边的多模态图的形成。然而,在多模态图上进行学习,同时利用每种模态的基础模型的生成能力,仍然是DLG中的一个开放性问题。在本论文中,我提出从四个维度使DLG更加实用:1)自动化,2)可扩展性,3)隐私性,4)多模态性。首先,我们在消息传递框架下自动化算法搜索和超参数调优。然后,我们提出对每个节点的邻域进行采样,以调节计算成本,同时自适应地过滤掉针对目标任务的噪声邻居,以应对可扩展性问题。针对隐私问题,我们重新定义了包括图生成和迁移学习在内的传统问题定义,使其意识到实际图的专有性和隐私受限的特点。最后,我提出了一种新的多模态图学习算法,该算法建立在单模态基础模型之上,并基于多模态邻居信息生成内容。随着人类收集的数据在规模和多样性上的增加,个体元素之间的关系在规模和复杂性上呈指数级增长。通过使DLG更加可扩展、隐私认证和多模态,我们希望能够更好地处理这些关系,并对广泛的领域产生积极的影响。
http://ra.adm.cs.cmu.edu/anon/2024/abstracts/24-139.html
在计算机视觉和自然语言处理领域取得的近期成功中,现实世界数据的一个关键方面——关系信息——在AI模型中仍然未得到充分探索。传统模型主要在训练和推理过程中单独处理单个数据实体,例如一张图片或一句话。相反,许多现实世界的应用本质上涉及富含关系结构的数据,这些数据自然可以表示为图,其中节点代表数据实体,边则编码了它们之间的关系。通过理解图中每个数据实体的关系,我们能够全面了解它与其他实体的相关性或联系。例如,在电子商务中,一个产品的上下文不仅仅通过其描述来解读,还可以通过电子商务图中相邻节点的用户评论、商家信息或共同购买的产品来分析。图上的深度学习(Deep Learning on Graphs,DLG)提出了多种深度学习方法,通过捕捉图中的潜在归纳偏差来学习节点、边、子图和图的有效表示【20,75】。DLG在多个领域取得了突破,从传统的图应用,如电子商务/社交平台中的产品/好友推荐【88,176】、社交网络中的虚假信息检测【10】、金融交易网络中的欺诈检测【156】等,到新兴的图应用,包括导航应用中的ETA预测【29】、流行病学中的疫情预测【22,112】以及生物学中的药物开发【70】。
DLG旨在通过图结构和邻域信息学习理解这个相互关联的世界,并改进对每个数据实体的理解。然而,当我们尝试在实践中实现DLG时,会面临源自现实世界图特征的诸多挑战。
鉴于超参数调优、可扩展性、隐私性和多模态等四个阻碍DLG广泛应用于现实世界中的挑战,我定义了新的问题,旨在解决这些挑战,并提出了可以在现实世界图上部署的实用解决方案。