WSDM 2022 | 基于图神经网络的协同过滤设计空间研究

近年来，图神经网络（Graph Neural Network，GNN）被广泛应用于协同过滤（Collaborative Filtering，CF）这一推荐系统中最流行的技术之一。然而，大多数现有工作关注特定推荐场景下的单个最优模型架构设计，而缺少模型不同设计维度对推荐性能影响的理解。因此，如何在新的推荐场景中快速获得高性能模型仍然是一个具有挑战性的问题。为解决这一问题，在本工作中，我们首次尝试对基于GNN的CF方法的设计空间进行剖析，以丰富我们对不同设计维度的理解，同时提供一种新颖的模型设计范式。我们提出了基于GNN的CF的统一设计框架，在此基础上提出设计空间，并通过大量实验评估不同设计维度对推荐性能的影响，得到有趣的实验发现。在实验结果的指导下，我们进一步压缩设计空间，使其更加紧凑，包含更高比例的高性能模型。实验结果表明，压缩后的设计空间具有质量高、泛化能力强的优点。

协同过滤是目前最流行的推荐技术之一，其目的是基于其他相似的用户行为来预测目标用户的偏好，普遍做法为首先学习用户和商品的低维表示，然后使用一个交互函数来预测用户对商品的偏好（评分）。最近，许多工作将GNN引入CF并取得了良好效果，用户-商品交互记录可被自然地建模为二部图的形式，GNN可以通过迭代消息传递（邻居聚合）来捕获用户-商品二部图中的高阶信息，从而更好地学习用户/商品表示。

现有基于GNN的方法主要局限于为特定的推荐场景设计单一的最佳模型架构，而在现实世界的应用中，由于推荐数据在其收集领域和各项属性（如规模（大或小）和密度（稠密或稀疏）等方面的多样性，推荐场景是丰富多样的。这种多样性使得研究者或从业者需要为不同的推荐场景设计不同的架构，模型中每个设计维度的最优选择（例如聚合函数或激活函数）因推荐场景而异。此外，现有工作虽然设计了各种新的基于GNN的CF模型，但对基于GNN的CF不同设计维度对推荐性能的影响却鲜有系统研究。因此，每次给定一个新的推荐场景，都需要包括计算资源和人力资源在内的巨大投入，探索GNN模型所有维度的巨大组合空间，以获得性能最佳的模型。

为解决以上问题，在本工作中，我们首次尝试对基于GNN的CF设计空间进行剖析，这不仅能加深领域研究者对模型不同设计维度的理解，也为多样推荐场景下高性能GNN模型的高效设计提供了新的范式；在这些理解的指导下，我们对原设计空间进行了压缩，以获得一个紧凑的空间，其中包含更高浓度的高性能模型。实验表明，压缩后的设计空间具有较高的质量和较强的泛化能力。

成为VIP会员查看完整内容