SIGIR2022 | HCCF: 结合超图与对比学习的协同过滤推荐算法

2022 年 5 月 17 日 机器学习与推荐算法

Title:Hypergraph Contrastive Collaborative Filtering

Link:https://arxiv.org/pdf/2204.12200

Code:https://github.com/akaxlh/HCCF

From:SIGIR 2022


预备知识:超图:https://zhuanlan.zhihu.com/p/361471954

不得不说现在超图也是图学习中挺火的一块领域,最近看到了好多用超图做推荐的,所以今天跟大家分享一篇超图结合对比学习的推荐方法,时间不足的小伙伴可以进入第二节懒人阅读


1. 导读




协同过滤 (CF) 已经成为将用户和商品参数化到潜在表征空间的基本范式,它们的相关模式来自交互数据。现有的基于GNN的推荐方法中存在两个挑战尚未得到很好的探索:

  • i)  基于图的 CF 架构的 过度平滑效应可能导致无法区分的用户表征导致推荐结果的退化。
  • ii) 监督信号(即用户-商品交互)在现实中通常是稀缺且偏斜分布的,这限制了 CF 范式的表征能力。

本文提出了一种新的自监督推荐框架HCCF,以通过超图增强的跨视图对比学习架构共同捕获局部和全局协同关系。超图结构学习增强基于 GNN 的 CF 范式的判别能力,从而全面捕捉用户之间复杂的高阶依赖关系。并且,HCCF 模型有效地将超图结构编码与自监督学习相结合,以增强推荐系统的表征质量。


2. 懒人阅读




本文主要是在图结构上结合对比学习进行协同过滤,

  • 局部协同关系编码,这部分是利用常见的方法如LightGCN这类方法进行信息传递和聚合,并且在聚合的时候利用残差的方式连接前一层和当前层的计算结果,缓解过度平滑
  • 全局依赖关系,这部分采用超图结构, 首先,超图中节点对应的超边矩阵是可学习的,因此超图的结构是学习得到的; 其次,为了避免直接学习上述超边矩阵这样一个稠密的大矩阵,作者对其进行了分解,由节点embedding和参数W计算,有点类似于FM中的分解; 然后,分层映射部分,是在多层超图消息传播的过程中对超边也进行交互,即整个传播过程中,通过超图结构聚合节点embedding,当前层节点的embedding是由局部协同部分得到,并且交互超边embedding;
  • 聚合多阶消息传播得到的用户/商品局部embedding和超图embedding,进行预测,利用pairwise损失计算损失值
  • 对比学习阶段是约束每一层超图得到的embedding和局部协同部分得到的embedding的一致性,从而得到较好的表征
  • 在原始图结构和超图结构中引入边dropout防止过拟合


3. 方法




如图所示为HCCF的整体架构。
  • 首先,利用基于图的消息传递模块作为编码器来捕获用户和商品之间的 局部协同相似性。( 人话:用常用的图提取用户和商品的embedding
  • 其次,提出一种新的具有 全局依赖结构学习的超图神经网络,以全面捕捉图神经 CF 范式的全局协作效应。( 人话:学习一个超图结构来反映依赖关系
  • 最后,引入了一种新的超图对比学习架构,具有互补的自提炼视图。

3.1 局部协同关系编码

按照常见的协同过滤范式,分别用 , 表示每个用户 和商品 的embedding。令 , 来表示所有用户和商品的embedding矩阵。基于LightGCN,局部图embedding的消息传播方式如下,z为从邻域聚合消息后的表征,σ为leakyrelu激活函数, 表示标准化的邻接矩阵,由用户-商品交互矩阵计算得到,公式如下,其中 , 表示对角度矩阵。N为当前节点的邻居节点。

通过集成多个embedding传播层,细化用户/商品表征以聚合局部邻域信息生成上下文embedding。假设 , 表示用户 和商品 在第 层GNN的embedding。从 层到 层的消息传递公式如下:

利用残差连接对源节点和目标节点进行自信息合并这强调了中心节点的语义并缓解了GNN的过度平滑问题

3.2 超图全局依赖学习

3.2.1 超图消息传递范式

超图由一组顶点和超边组成,其中每个超边可以连接任意数量的顶点。( 根据“预备知识”的链接,根据一个准则将一阶节点分为一组,这一组节点就由一个超边连接)在超图协同过滤场景中,利用超边对跨用户和商品的全局感知信息进行传递。超图消息传递范式的模型结构如图3所示

定义用户和商品的超图依赖矩阵为 其中H表示超边的数量,消息传递方式可以表示为下式,其中 表示用户对应的超边embedding,σ为leakyrelu, 表示在第 传播层下的超图表征空间中用户的超embedding。同理可得商品的超embedding 。而 表示在局部图消息传播时得到的用户表征矩阵,H为可学习参数矩阵。

3.2.2 参数化超图结构学习

通过学习上述的H矩阵来得到用户和商品的基于超图的依赖结构,这里以用户的 为例,商品的超图矩阵计算方式也是类似的。通过可训练的 可以通过 得到节点与节点之间的关系。直接学习上述这样一个稠密矩阵H需要高昂的计算成本。作者以低秩方式将矩阵参数化到潜在空间(这里有点类似FM中将w分解为v),具体如下

3.2.3 分层超图映射

为了进一步进行超边特征交互,通过堆叠大小为H的不同超边层来增强HCCF。上面的超边集将作为第一个超图层,它将与深层超图层非线性交互。深层的超边embedding用编码函数ψ()得到,如下所示, 为是用户或商品的超边embedding,E为用户或商品表征,V为可学习参数,σ为leakyrelu函数。

根据上式可以得到用户或商品经过分层超图映射后的表征为,

3.3 多阶聚合和预测

为了将局部依赖编码与全局协作关系建模相结合,本文迭代地执行图局部embedding传播和超图信息聚合,公式如下,其中 阶从邻居聚合信息后得到的用户表征, 通过超图得到的第 阶用户表征,

进一步将残差操作应用于embedding聚合。通过元素embedding求和生成多阶用户/商品embedding,并利用它们的内积来估计用户和项目之间的交互偏好得分,公式如下,

采用pairwise损失函数,如下,对于每个用户 采样S个正负样本

3.4 超图增强的对比学习

3.4.1 超图引导的对比

通过最大化显式用户-商品交互关系和隐式基于超图的依赖关系之间的一致性来设计对比学习组件。生成两个表示视图,即 i) 用户-商品交互图上的局部协作关系编码, ii) 用户/商品之间的全局超图结构学习。这种对比学习利用了用户和商品的自判别,从局部和全局表征空间提供辅助监督信号。

3.4.2 跨视图协同监督

同一用户/商品的不同视图视为正对 ,并将不同用户/商品的视图视为负对。模型通过对比生成的正例和负例来学习判别表征。使用 InfoNCE将用户表征的对比损失正式定义为下式,其中s()为余弦相似度,

3.4.3 图结构上的数据增强

为了进一步缓解跨视图对比学习过程中的过度拟合问题,在用户-商品交互图和学习的超图结构上设计边dropout,如下, 表示逐元素相乘, 是掩码矩阵用于dropout,

总体损失函数如下,



4. 结果




image.png



欢迎干货投稿 \ 论文宣传 \ 合作交流

推荐阅读

论文周报 | 推荐系统领域最新研究进展
KDD2022 | 可信推荐系统征稿
综述 | 推荐系统偏差与去偏总结

由于公众号试行乱序推送,您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容, 请将本号设为星标,以及常点文末右下角的“在看”。

喜欢的话点个在看吧👇
登录查看更多
1

相关内容

【KDD2022】自监督超图Transformer推荐系统
专知会员服务
33+阅读 · 2022年8月1日
SIGIR2022|基于注意力超图网络的交互协同聚类
专知会员服务
24+阅读 · 2022年5月14日
【NeurIPS2021】由相似性迁移的弱样本细粒度分类
专知会员服务
20+阅读 · 2021年11月11日
专知会员服务
35+阅读 · 2021年5月28日
专知会员服务
40+阅读 · 2021年5月24日
【WWW2021】双曲图卷积网络的协同过滤
专知会员服务
39+阅读 · 2021年3月26日
【WSDM2021】保存节点相似性的图卷积网络
专知会员服务
40+阅读 · 2020年11月22日
【KDD2020】 半监督迁移协同过滤推荐
专知会员服务
19+阅读 · 2020年10月21日
专知会员服务
73+阅读 · 2020年9月1日
SIGIR2022 | 推荐算法之对比学习篇
机器学习与推荐算法
6+阅读 · 2022年7月21日
SIGIR2022 | 基于森林的深度推荐算法
机器学习与推荐算法
0+阅读 · 2022年7月18日
SIGIR2022 | SimGCL: 面向推荐系统的极简图对比学习方法
机器学习与推荐算法
0+阅读 · 2022年5月5日
WSDM2022 | 考虑行为多样性与对比元学习的推荐系统
机器学习与推荐算法
2+阅读 · 2022年2月24日
[KDD 2020] 双通道超图协同过滤
图与推荐
0+阅读 · 2022年2月18日
SIGIR 2021 | 推荐系统中的多行为建模
PaperWeekly
1+阅读 · 2021年10月9日
对比学习+图神经网络=更好的推荐系统?
图与推荐
0+阅读 · 2021年9月16日
基于对比学习的推荐算法总结
机器学习与推荐算法
1+阅读 · 2021年9月16日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2022年7月29日
Arxiv
18+阅读 · 2021年6月10日
Arxiv
15+阅读 · 2019年4月4日
Arxiv
23+阅读 · 2018年10月1日
VIP会员
相关VIP内容
【KDD2022】自监督超图Transformer推荐系统
专知会员服务
33+阅读 · 2022年8月1日
SIGIR2022|基于注意力超图网络的交互协同聚类
专知会员服务
24+阅读 · 2022年5月14日
【NeurIPS2021】由相似性迁移的弱样本细粒度分类
专知会员服务
20+阅读 · 2021年11月11日
专知会员服务
35+阅读 · 2021年5月28日
专知会员服务
40+阅读 · 2021年5月24日
【WWW2021】双曲图卷积网络的协同过滤
专知会员服务
39+阅读 · 2021年3月26日
【WSDM2021】保存节点相似性的图卷积网络
专知会员服务
40+阅读 · 2020年11月22日
【KDD2020】 半监督迁移协同过滤推荐
专知会员服务
19+阅读 · 2020年10月21日
专知会员服务
73+阅读 · 2020年9月1日
相关资讯
SIGIR2022 | 推荐算法之对比学习篇
机器学习与推荐算法
6+阅读 · 2022年7月21日
SIGIR2022 | 基于森林的深度推荐算法
机器学习与推荐算法
0+阅读 · 2022年7月18日
SIGIR2022 | SimGCL: 面向推荐系统的极简图对比学习方法
机器学习与推荐算法
0+阅读 · 2022年5月5日
WSDM2022 | 考虑行为多样性与对比元学习的推荐系统
机器学习与推荐算法
2+阅读 · 2022年2月24日
[KDD 2020] 双通道超图协同过滤
图与推荐
0+阅读 · 2022年2月18日
SIGIR 2021 | 推荐系统中的多行为建模
PaperWeekly
1+阅读 · 2021年10月9日
对比学习+图神经网络=更好的推荐系统?
图与推荐
0+阅读 · 2021年9月16日
基于对比学习的推荐算法总结
机器学习与推荐算法
1+阅读 · 2021年9月16日
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员