© 作者|田震
机构|中国人民大学
研究方向|推荐系统
本文搜集了最近几年发表在各类会议的点击率预测领域相关论文,聚焦于其中的图神经网络模型,梳理其背后的技术脉络,旨在帮助推荐系统相关研究人员快速熟悉和掌握 基于图神经网络的跨域推荐系统的最新研究进展,如有遗漏或错误,欢迎大家指正。文章也同步发布在AI Box知乎专栏(知乎搜索 AI Box专栏),欢迎大家在知乎专栏的文章下方评论留言,交流探讨!
引言:图神经网络凭借其强大的泛化能力在计算机视觉与自然语言处理等领域取得了出色进展。为了解决点击率预测任务中面临的特征数据稀疏、泛化能力差等问题,不少工作使用图神经网络学习模型中特征之间的关系,以及进行特征交互建模。笔者整理了近年来利用图神经网络进行点击率预测的工作,这些工作在特征交互建模以及用户行为挖掘等方面取得了不错效果。欢迎大家批评指正,相互交流。
论文列表
1. Explicit Semantic Cross Feature Learning via Pre-trained Graph Neural Networks for CTR Prediction. (SIGIR 2021)
本文来自于阿里,作者主要提出了一种利用GNN进行显式交互统计建模的方法。目前CTR领域大多数工作都聚焦于隐式特征交互,而利用显式交互统计特征进行建模的工作较少。进行显式统计特征建模面临的问题主要有:泛化能力不强,无法提取交互历史没有出现过的特征组合;计算资源代价较大,对于显式统计特征,通常需要维护一张不同特征组合笛卡尔积的存储表,需要巨额存储开销。为了解决这个问题,作者利用GNN引入了显式交互统计特征学习的预训练任务。
如图所示,作者首先根据历史交互记录构建后验特征交互图。图顶点代表特征,即user、item、shop。边为不同组合特征对应的显式交互统计特征,其计算公式为:
GNN预训练过程如图所示,整体流程与GraphSAGE相同,分为邻居结点聚合以及结点表征融合两个过程。邻居结点聚合过程采用multi-relation based aggregation function考虑不同结点之间的关系,在得到邻居节点聚合信息后融合自身上一时刻的表征,最终输出每个结点最后时刻的状态向量
2. Dual Graph enhanced Embedding Neural Network for CTR Prediction. (KDD 2021)
本文来自于华为,主要探索CTR任务中特征交互引起的特征稀疏性与行为稀疏性的解决方案,主要采用分治法和课程学习的思路结合GNN进行特征表示学习。
如图所示,DG-ENN首先通过属性图卷积以及协同图卷积学习特征的最佳表示,然后将其应用到下游的CTR任务中。在属性图卷积过程,作者主要构造了两种类型的属性图,分别是用户图
在协同图卷积过程,作者利用用户与物品间的协同信号缓解了用户行为序列面临的稀疏性问题。用户-物品的协同图可以表示为一个二分图
3.Graph Intention Network for Click-through Rate Prediction in Sponsored Search. (SIGIR 2019)
本文来自阿里,主要利用图神经网络进行用户兴趣挖掘,其动机源于已有用户意图模型面临的行为稀疏性问题以及泛化能力弱等问题。其主要创新点在于构造出了一种商品共现图,并基于此提出了图意图网络,利用多层图聚合挖掘用户意图。
商品共现图的构造过程如上图所示,其中作者首先根据查询的相似度将用户的历史行为序列分割为不同的会话,然后对每个会话中的商品使用滑动窗口添加无向边,因此共现图中的边权重代表了不同商品对出现的次数。
4.Masked Transformer for Neighhourhood-aware Click-Through Rate Prediction. (SIGIR 2022)
本文来自于腾讯,主要利用图神经网络增加用户和商品的表征。作者首先指出,目前推荐系统的性能受限于用户的行为分布以及系统曝光,这些因素导致模型提取到的特征信息量不足,从而导致预测的准确率下降。为了解决这个问题,作者提出了异构信息网络HIN,通过构造节点之间的不同拓扑交互结构来增强提取的特征信息。
其中微信视频推荐场景的异构图如图所示。其节点有用户、视频、文章以及公众号四种类型。其边有用户-<点击>-视频,用户-<点击>-文章,用户-<订阅>-公众号,公众号-<发布>-视频以及公众号-<发布>-文章五种类型。异构图可形式化表述为
HIN的结构如图所示。作者首先提出了一种贪心领域采样算法选取图结点,其主要思想是尽可能多地对低阶邻居进行采样,对每类结点均采取一定数量,并且尽可能多地选取与其它结点连接比较多的节点。对于用户 u 以及物品 v ,其贪心领域采样算法选取的邻居节点表示为
5. Fi-GNN: Modeling Feature Interactions via Graph Neural Networks for CTR Prediction.(CIKM 2019)
本文主要利用图神经网络进行端到端地隐式特征交互建模。作者首先指出目前大部分工作在进行特征交互建模时简单地将特征域进行非结构化地结合,这种做法不可避免地会限制模型的能力。为了灵活地捕捉不同特征域的特征交互,作者将所有特征域建模为特征图,利用图信息传递建模高阶特征交互。
模型的整体结构如图所示,作者首先将所有特征构建为一个特征图
其中特征图的拓扑结构为全连接结构,即图的邻接矩阵可以表示为
图交互过程如上图所示。为了减少计算复杂度,作者首先将聚合矩阵进行分解:
6.GraphFM: Graph Factorization Machines for Feature Interaction Modeling. (arXiv)
本文是Fi-GNN作者提出的利用图神经网络进行特征交互建模的又一力作。作者首先指出了目前的因子分解机模型存在无法有效捕获高阶特征交互并且枚举无效交互引入噪声的缺点。为了构造高阶特征交互的同时过滤无效交互,作者采用交互选择-交互聚合两阶段的方式进行特征交互建模。
模型结构如图所示,整体可以分为交互选择以及交互聚合两个过程,在交互选择过程确定图的拓扑结构构图,然后利用图聚合进行特征交互。
作者首先采用MLP量化不同节点之间的重要程度:
即在交互选择过程中只保留前
在交互聚合过程,作者引入软注意力机制计算交互权重:
聚合过程同时结合交互选择过程的硬注意力权重控制交互信息:
小结
本文总结了近年来利用图神经网络进行点击率预测的工作。大部分工作主要利用图神经网络优化特征工程,增强特征表示,能够有效地解决特征建模面临的特征稀疏以及泛化能力不强等问题。同时也有一部分工作尝试利用图神经网络建模特征交互,能够更加方便地集成到现有的精排模型中。然而,大部分图神经网络工作需要进行全局的非端到端建模,计算复杂度较高。如何设计轻量级且易部署的图模型仍是一个值得探索的课题。