来自 | 知乎
地址 | https://zhuanlan.zhihu.com/p/114798371
作者 | Plato
什么是协同过滤?如何用协同过滤做推荐?
NGCF是如何构图的?NGCF在基础的GNN上有哪些改动?如何用NGCF做推荐?
协同过滤(CF)是一种常用的推荐系统做法。协同,指收集广大用户的口味;过滤,指过滤出『我』可能喜欢的物品。这个方法通过收集用户的兴趣和口味,给用户推荐口味相近的人喜欢的物品。
在构建推荐系统的过程中,我们收集了很多用户与物品的交互历史,比如豆瓣电影中用户对电影的打分;淘宝中用户对物品的浏览、购买等。这些交互历史能够表示成一个用户 、物品 的交互矩阵 。
协同过滤模型需要 1. 用向量表示用户的口味 、物品的特性 ;2. 通过用户的口味、物品的特性去近似交互历史 ;3. 给用户 推荐交互得分最高的物品 。
矩阵分解(MF)是一种基础的协同过滤模型。
MF大致过程如下(另可参考视频[1]):
将用户看成矩阵 ,物品看做矩阵 , 为embedding长度
使用矩阵的乘积 去近似交互矩阵 ,使用梯度下降法最小化 ,求解
MF的输入单一,不能使用用户与物品的特征作为输入;同时MF对稀疏的交互矩阵效果较差。NGCF作者认为使用GNN能同时解决这两个问题。
GNN使用节点特征作为初始embedding,可以在这里加入用户特征、物品特征;
GNN能够引入『高阶交互历史信息』。
例如『你浏览的这个电影,喜欢它的用户也喜欢以下电影』这种『用户-物品-用户-物品』三阶信息,就是一种『高阶交互历史信息』。这种信息在推荐系统中无疑是非常重要的。
那么作者在论文中如何将GNN加入协同过滤系统的呢?首先,要将历史交互构图;然后,在这个交互图上,使用GNN来嵌入『高阶交互历史信息』,获得节点(用户、物品)的embedding;最后,通过embedding来近似历史交互矩阵 。过程如下:
使用交互历史构图;
在图上,使用GNN学习embedding ;
和MF类似,使用矩阵的乘积 去近似交互矩阵。
作者希望使用GNN对高阶交互历史进行建模,就首先要对交互历史进行构图。左图是由用户、物品的交互历史构成的二部图;右图是将左图围绕 展开,获得该点的『高阶历史信息』。
在GNN中,节点的embedding初始化成节点的特征,然后通过聚合邻居及自己上一层的 ,获得新一层的 。
在NGCF中,第k-1层的节点信息是这样聚合到第k层的:
将每个用户 所有layer的embedding连接起来作为用户最终embedding
将每个物品 所有layer的embedding连接起来作为物品最终embedding
将点积 作为最后的模型预测值
使用了推荐系统常用的pairwise BPR loss,能对正样本和负样本加上不同的权重,使正样本能特别体现用户的口味,负样本能少量体现用户的口味
在用t-SNE降维后,下图是对NGCF与MF的embedding可视化。星星是一个用户,圆圈是一个物品。可以看到NGCF的clusters彼此之间更加分离,即同一个用户交互过的物品,它们的embeddings更加相似。
作者还在Gowalla、Yelp2018、Amazon-Book三个数据集上对比了推荐效果,NGCF均为state of the art。
其他:NGCF作者的论文[2]与实现[3]。
^How does Netflix recommend movies? Matrix Factorization https://www.youtube.com/watch?v=ZspR5PZemcs
^https://arxiv.org/abs/1905.08108
^https://github.com/xiangwang1223/neural_graph_collaborative_filtering