SIGIR2022 | HCCF: 结合超图与对比学习的协同过滤推荐算法

2022 年 5 月 17 日 机器学习与推荐算法

Title：Hypergraph Contrastive Collaborative Filtering

Link：https://arxiv.org/pdf/2204.12200

Code：https://github.com/akaxlh/HCCF

From：SIGIR 2022

预备知识：超图：https://zhuanlan.zhihu.com/p/361471954

不得不说现在超图也是图学习中挺火的一块领域，最近看到了好多用超图做推荐的，所以今天跟大家分享一篇超图结合对比学习的推荐方法，时间不足的小伙伴可以进入第二节懒人阅读

1. 导读

协同过滤 (CF) 已经成为将用户和商品参数化到潜在表征空间的基本范式，它们的相关模式来自交互数据。现有的基于GNN的推荐方法中存在两个挑战尚未得到很好的探索：

i) 基于图的 CF 架构的 过度平滑效应可能导致无法区分的用户表征导致推荐结果的退化。
ii) 监督信号（即用户-商品交互）在现实中通常是稀缺且偏斜分布的，这限制了 CF 范式的表征能力。

本文提出了一种新的自监督推荐框架HCCF，以通过超图增强的跨视图对比学习架构共同捕获局部和全局协同关系。超图结构学习增强基于 GNN 的 CF 范式的判别能力，从而全面捕捉用户之间复杂的高阶依赖关系。并且，HCCF 模型有效地将超图结构编码与自监督学习相结合，以增强推荐系统的表征质量。

2. 懒人阅读

本文主要是在图结构上结合对比学习进行协同过滤，

局部协同关系编码，这部分是利用常见的方法如LightGCN这类方法进行信息传递和聚合，并且在聚合的时候利用残差的方式连接前一层和当前层的计算结果，缓解过度平滑
全局依赖关系，这部分采用超图结构，首先，超图中节点对应的超边矩阵是可学习的，因此超图的结构是学习得到的；其次，为了避免直接学习上述超边矩阵这样一个稠密的大矩阵，作者对其进行了分解，由节点embedding和参数W计算，有点类似于FM中的分解；然后，分层映射部分，是在多层超图消息传播的过程中对超边也进行交互，即整个传播过程中，通过超图结构聚合节点embedding，当前层节点的embedding是由局部协同部分得到，并且交互超边embedding；
聚合多阶消息传播得到的用户/商品局部embedding和超图embedding，进行预测，利用pairwise损失计算损失值
对比学习阶段是约束每一层超图得到的embedding和局部协同部分得到的embedding的一致性，从而得到较好的表征
在原始图结构和超图结构中引入边dropout防止过拟合

3. 方法

如图所示为HCCF的整体架构。

首先，利用基于图的消息传递模块作为编码器来捕获用户和商品之间的 局部协同相似性。（ 人话：用常用的图提取用户和商品的embedding）
其次，提出一种新的具有 全局依赖结构学习的超图神经网络，以全面捕捉图神经 CF 范式的全局协作效应。（ 人话：学习一个超图结构来反映依赖关系）
最后，引入了一种新的超图对比学习架构，具有互补的自提炼视图。

3.1 局部协同关系编码

按照常见的协同过滤范式，分别用 , 表示每个用户和商品的embedding。令 , 来表示所有用户和商品的embedding矩阵。基于LightGCN，局部图embedding的消息传播方式如下，z为从邻域聚合消息后的表征，σ为leakyrelu激活函数，表示标准化的邻接矩阵，由用户-商品交互矩阵计算得到，公式如下，其中 , 表示对角度矩阵。N为当前节点的邻居节点。

通过集成多个embedding传播层，细化用户/商品表征以聚合局部邻域信息生成上下文embedding。假设 , 表示用户和商品在第层GNN的embedding。从层到层的消息传递公式如下：

利用残差连接对源节点和目标节点进行自信息合并。这强调了中心节点的语义并缓解了GNN的过度平滑问题。

3.2 超图全局依赖学习

3.2.1 超图消息传递范式

超图由一组顶点和超边组成，其中每个超边可以连接任意数量的顶点。（ 根据“预备知识”的链接，根据一个准则将一阶节点分为一组，这一组节点就由一个超边连接）在超图协同过滤场景中，利用超边对跨用户和商品的全局感知信息进行传递。超图消息传递范式的模型结构如图3所示

定义用户和商品的超图依赖矩阵为，其中H表示超边的数量，消息传递方式可以表示为下式，其中表示用户对应的超边embedding，σ为leakyrelu，表示在第传播层下的超图表征空间中用户的超embedding。同理可得商品的超embedding 。而表示在局部图消息传播时得到的用户表征矩阵，H为可学习参数矩阵。