摘要
推荐系统,是一种以向用户呈现个性化信息为目标的过滤系统,可以提高用户体验,提高企业利润。作为由现实世界驱动的机器学习的典型应用之一,它是当今工业界和学术界的一个非常热门的话题。
回顾推荐系统的发展历程,一般可将其分为三个阶段:浅层模型[74,125,126]、神经模型[26,48,56]和基于GNN的模型[55,153,188]。最早的推荐模型通过直接计算交互的相似度来捕捉协同过滤(CF)效应。然后,提出了基于模型的CF方法,如矩阵分解(MF)[74]或分解机[125],将推荐作为一个表示学习问题来处理。然而,这些方法面临着复杂的用户行为或数据输入等关键挑战。为了解决这个问题,我们提出了基于神经网络的模型[26,48,56]。例如,神经协同过滤(neural collaborative filtering, NCF)被开发用于扩展多层感知器(multi-layer perceptrons, MLP)内积,以提高其能力。同样,深度因子分解机(DeepFM)[48]将浅层模型因子分解机(FM)[125]与MLP结合。然而,由于这些方法的预测和训练模式忽略了观测数据中的高阶结构信息,因此仍然存在很大的局限性。例如,NCF的优化目标是预测用户-物品交互,训练样本包括观察到的正向用户-物品交互和未观察到的负向用户-物品交互。这意味着在对特定用户进行参数更新时,只涉及他/她交互的项。
近年来,图神经网络的发展为解决推荐系统中的上述问题提供了坚实的基础和机遇。具体来说,图神经网络采用嵌入传播的方法迭代地聚合邻域嵌入。通过叠加传播层,每个节点可以访问高阶邻居的信息,而不是传统方法只访问一阶邻居的信息。基于GNN的推荐方法以其处理结构化数据和挖掘结构化信息的优势,已成为推荐系统中最先进的方法。为了将图神经网络很好地应用到推荐系统中,有一些关键的挑战需要解决。首先,将推荐系统的数据输入仔细地构造成图,节点表示元素,边表示元素之间的关系。其次,对于具体的任务,需要自适应地设计图神经网络中的构件,包括如何传播和聚合,现有的工作在这方面探索了各种各样的选择,各有优缺点。第三,基于GNN模型的优化,包括优化目标、损失函数、数据采样等,应与任务要求一致。最后,由于推荐系统对计算成本有严格的限制,而且由于GNN的嵌入传播操作引入了大量的计算,图神经网络在推荐系统中的有效部署是另一个关键的挑战。
在本文中,我们旨在提供一个系统和全面的研究工作,特别是他们如何改进图神经网络的推荐和解决相应的挑战。为了更清晰地理解推荐系统,我们从阶段、场景、目标和应用四个方面对推荐系统的研究进行了分类。我们总结了https://github.com/tsinghua-fib-lab/ gnn - recommendation - systems中具有代表性的论文及其代码库。 值得一提的是,已有一项基于图神经网络的推荐系统的综述[168]。然而,由于以下原因,它是有限的。首先,它没有提供广泛的推荐系统分类。具体来说,它将推荐系统大致分为非序列推荐和序序推荐,但这并不合理。事实上,正如本调研所指出的那样,序列推荐只是一个具有特殊输入和输出设置的特定推荐场景。第二,它没有提供足够的动机和原因,现有的工作利用图神经网络推荐系统。而在本次调研中,我们对GNN为什么可以和应该被用于推荐系统提供了一个全面的理解,有助于读者理解这一新的研究领域的地位和价值。第三,它没有解释将图神经网络应用于推荐的关键挑战以及如何解决这些挑战,这在本调研中已经充分讨论。最后,由于这一领域越来越受欢迎,我们的调研也介绍了许多最近发表的论文[168]没有涉及。
本次综述的结构组织如下。在第2节中,我们首先从阶段、场景、目标、应用四个方面介绍了推荐系统的背景,以及图神经网络的背景。在第三节中,我们从四个方面讨论了在推荐系统中应用图神经网络所面临的挑战。然后我们按照上节的分类,在第4节中详细阐述了基于图神经网络的推荐的代表性方法。在第5节中,我们讨论了这一领域中最关键的开放问题,并提供了未来方向的想法,在第6节中总结了这个综述。