SIGIR21@阿里 | 基于图神经网络和元学习的冷启动推荐算法

2021 年 12 月 14 日 机器学习与推荐算法

Learning Graph Meta Embeddings for Cold-Start Ads in Click-Through Rate Prediction, SIGIR 2021
https://arxiv.org/pdf/2105.08909.pdf

公式太长可以左右滑动

1. 背景

对于训练好的推荐模型，当遇到冷启动的商品时，由于缺乏充分的数据，无法学习到好的embedding，从而会导致性能下降。本文提出Graph Meta Embedding (GME) 方法，利用图神经网络和元学习快速学习生成冷启动商品的初始id embedding。GME一方面考虑商品自身的属性信息，另一方面考虑旧商品和冷启动商品之间的关系。

GME主要包含两个部分：EG（embedding generator）和GAT。EG用于生成id embedding，GAT用于蒸馏信息。从不同的角度分别提出了GME-P，GME-G，GME-A，GME-A效果最好。

2. 方法

2.1 符号

2.2 总体

GME仅针对冷启动的商品，如上图所示，当广告进来后，进行查找，若能找到embedding，则为旧的，若找不到在进行GME来生成初始embedding。

2.3 建图

GME需要构建新商品和旧商品之间的关系，因此需要先对其进行建图。由于需要构建新商品和旧商品之间的关系，因此无法使用点击关系进行构建，本文作者采用商品的属性特征来构建商品之间的关系，如下图所示。

如果采用邻接矩阵来表示新商品和旧商品之间的关系，就需要为每一个新商品都遍历一次旧商品的集合，因此非常耗时。换一种方式， 对当前的新商品，获取其id，特征后，去查找旧商品中具有相同特征值的商品的集合作为当前新商品的邻居。具体实现流程可以看论文中图4的上下文。

2.4 GME-P: Using Pre-trained Neighbor ID Embeddings

如图所示为GME-P的示意图，GME-P利用新商品的属性和预训练得到的邻居旧商品的id embedding来得到冷启动新商品的id embedding。首先利用新商品的属性来生成一个基础的id embedding ，然后利用这些邻居embedding 的有用信息来细化基础id embedding 。

2.4.1 ID Embedding Generation

这部分利用新商品相关的属性特征（包括类别，品牌等）生成基础的id embedding。将商品实例表示为，ID表示商品id，x表示和商品相关的特征，o表示和商品不相关的特征（如用户特征，上下文特征等）。将商品相关的特征的embedding拼接后得到，然后通过下式得到。其中w为可学习参数，γ为缩放超参数。

2.4.2 ID Embedding Refinement

基于上面构建的商品之间的关系图，本节作者采用GAT将邻居信息整合到新商品中，计算注意力机制系数公式如下，leakyrelu的系数为0.2。这里的注意力系数不仅计算了新商品和邻居之间的系数，也计算新商品与自己的自注意力系数。

然后对所有embedding（包括自己和邻居）加权求和，公式如下，

2.4.3 分析

该方法用到的周围邻居的embedding是原始推荐系统模型中得到的，没有在属性和id embedding之间加任何约束，并且所有embedding都是随机初始化的。可能遇到具有相同属性的两个商品之间的embedding差别很大，导致计算得到的注意力系数没有意义。

2.5 GME-G: Using Generated Neighbor ID Embeddings

如图所示为GME-G的示意图。为了解决GME-P的缺陷，GME-G将新商品和邻居旧商品都通过EG结合对应的属性来得到他们的embedding。

2.5.1 ID Embedding Generation

这里生成方式和GME-P一样，公式如下，其中g0表示新商品，gi表示邻居。

2.5.2 ID Embedding Refinement

这里细化的方式和GME-P一样，只是把GME-P中直接由预训练好的推荐模型得到embedding的方式改成了同样适用EG来生成embedding，公式也是类似的，

2.5.3 分析

GME-G虽然解决了GME-P的缺陷，但是需要重复生成旧商品的embedding。生成的embedding可能存在噪声，而重复生成可能将噪声放大。

2.6 GME-A: Using Neighbor Attributes

未解决GME-G的问题，本节提出GME-A方法。如上图所示为GME-A的示意图，该方法将“生成”和“细化”两个步骤颠倒，并且在细化阶段细化的不再是id embedding而是属性的embedding。

2.6.1 Attribute Embedding Refinement

这部分通过上面建的商品属性关系图，利用邻居旧商品的属性和新商品的属性进行细化，公式如下，这里也是包含新商品自身和周围邻居一起计算的。

2.6.2 ID Embedding Generation

这部分就是直接采用细化后的属性embedding得到对应的id embedding。计算方式和前面类似。

2.7 模型学习

首选训练好一个常用的推荐模型，然后固定其参数不变，训练GME的参数。损失函数考虑两个方面：1）新商品的CTR预测误差应该要小，2）在少量标记实例收集后，应该要能根据少量梯度更新来快速学习。分别表示为以下两个损失函数。

对于给定的训练数据，随机从中选出两个不相交的minibatch ，分别包含M个样本。首先通过GME得到中的embedding ，然后得到预测概率，表示第j个样本的预测概率。交叉熵损失函数为下式，

然后计算关于初始embedding 的梯度，并经过一步梯度下降，可以得到新的自适应embedding，公式如下，

然后在上测试新的，他的损失函数为，

总的损失函数为

3. 结果

4. 总结

本文作者主要从新商品的属性以及新商品和旧商品之间在属性上的关系来生成更好的embedding，通过GAT融合邻居节点的信息得到更好的属性embedding，再用属性embedding得到冷启动商品的id embedding。

欢迎干货投稿 \ 论文宣传 \ 合作交流

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容，请将本号设为星标，以及常点文末右下角的“在看”。

喜欢的话点个在看吧👇

登录查看更多

相关内容

冷启动

关注 7

冷启动关注的是产品早期获取早期核心用户，以及如何运营的问题。

WSDM'22「京东」个性化会话推荐：异构全局图神经网络

专知会员服务

23+阅读 · 2022年1月7日

WSDM 2022 | 基于图神经网络的协同过滤设计空间研究

专知会员服务

37+阅读 · 2022年1月3日

【ACL2021】基于图表示的多元关系链接预测

专知会员服务

34+阅读 · 2021年8月9日

近期必读的5篇顶会WWW 2021【图神经网络+推荐】相关论文和代码

专知会员服务

49+阅读 · 2021年6月5日

图神经网络元学习

专知会员服务

97+阅读 · 2021年5月25日

【SIGIR2021】ScaleFreeCTR：超大规模Embedding推荐模型分布式训练系统

专知会员服务

28+阅读 · 2021年4月26日

【WSDM2021】基于交叉融合的无监督属性网络嵌入

专知会员服务

26+阅读 · 2020年12月17日

【KDD2020】图神经网络的无冗余计算

专知会员服务

38+阅读 · 2020年11月24日

【KDD2020】TAdaNet: 用于图增强元学习的任务自适应网络

专知会员服务

18+阅读 · 2020年9月21日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

WWW'22 | 推荐系统：基于邻域关系的对比学习改进图协同过滤

RUC AI Box

2+阅读 · 2022年3月21日

WSDM2022 | 考虑行为多样性与对比元学习的推荐系统

机器学习与推荐算法

2+阅读 · 2022年2月24日

WSDM'22「京东」个性化会话推荐：异构全局图神经网络

专知

0+阅读 · 2022年1月7日

CIKM'21 CBML | 基于聚类的元学习序列推荐方法

图与推荐

1+阅读 · 2021年12月21日

CIKM21 | 图+推荐系统: 比LightGCN更有效的UltraGCN

机器学习与推荐算法

2+阅读 · 2021年11月30日

TKDE 2020 | 面向严格冷启动推荐的属性图神经网络

PaperWeekly

13+阅读 · 2020年12月18日

论文浅尝 | ICLR2020 - 基于组合的多关系图卷积网络

开放知识图谱

21+阅读 · 2020年4月24日

KDD 2019开源论文 | 基于异质图神经网络的用户意图推荐

PaperWeekly

31+阅读 · 2019年11月2日

阿里深度序列匹配模型SDM：如何刻画大型推荐系统的用户行为？

AI100

21+阅读 · 2019年9月10日

网络节点表示学习论文笔记03—基于异构网络节点表示的推荐系统

专知

27+阅读 · 2018年2月24日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

大规模最大k割问题的离散动态凸化算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

模糊神经网络光滑化算法和最速下降算法的研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于组合地图模型的图像检索算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

序关系描述下的多源遥感图像配准算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于弱线性回归树在线学习的自适应视频目标检测算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于查询词级联关系的高阶信息检索问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多元异构信息融合的个性化推荐系统研究

国家自然科学基金

6+阅读 · 2012年12月31日

文本多粒度关系抽取半监督自适应学习的研究

国家自然科学基金

4+阅读 · 2012年12月31日

基于核、正则化与多目标优化技术的多标签分类算法及其应用研究

国家自然科学基金

1+阅读 · 2008年12月31日

Multi-Auxiliary Augmented Collaborative Variational Auto-encoder for Tag Recommendation

Arxiv

0+阅读 · 2022年4月20日

Improving Spectral Clustering Using Spectrum-Preserving Node Reduction

Arxiv

0+阅读 · 2022年4月18日

Data Augmentation for Graph Neural Networks

Arxiv

38+阅读 · 2020年12月2日

Attentive Graph Neural Networks for Few-Shot Learning

Arxiv

40+阅读 · 2020年7月14日

DPGN: Distribution Propagation Graph Network for Few-shot Learning

Arxiv

12+阅读 · 2020年3月31日

Few-Shot Knowledge Graph Completion

Arxiv

14+阅读 · 2019年11月26日

Meta-Learning to Cluster

Arxiv

17+阅读 · 2019年10月30日

Representation Learning with Ordered Relation Paths for Knowledge Graph Completion

Arxiv

12+阅读 · 2019年9月26日

Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning

Arxiv

21+阅读 · 2018年12月25日

Link Prediction Based on Graph Neural Networks

Arxiv

26+阅读 · 2018年2月27日

VIP会员

SIGIR21@阿里 | 基于图神经网络和元学习的冷启动推荐算法

公式太长可以左右滑动

2.1 符号

2.2 总体

2.3 建图

2.4 GME-P: Using Pre-trained Neighbor ID Embeddings

2.4.1 ID Embedding Generation

2.4.2 ID Embedding Refinement

2.4.3 分析

2.5 GME-G: Using Generated Neighbor ID Embeddings

2.5.1 ID Embedding Generation

2.5.2 ID Embedding Refinement

2.5.3 分析

2.6 GME-A: Using Neighbor Attributes

2.6.1 Attribute Embedding Refinement

2.6.2 ID Embedding Generation

2.7 模型学习

欢迎干货投稿 \ 论文宣传 \ 合作交流

推荐阅读

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容， 请将本号设为星标，以及常点文末右下角的“在看”。

相关内容

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容，请将本号设为星标，以及常点文末右下角的“在看”。