本文基于CIKM-2020论文《Graph Neural Network for Tag Ranking in Tag-enhanced Video Recommendation》,由腾讯微信和清华大学合作完成。
导语
一、模型背景与简介
(1)根据用户的喜好,显式地通过标签展示用户感兴趣的视频内容;
(2)吸引用户点击标签;
(3)引导用户在标签频道中进行深度阅读。
(1)用户在标签上的行为相对视频行为来说尤为稀疏,影响模型的监督训练;
(2)这个工作希望同时提升视频和标签相关的指标,但是这两者之间可能存在着gap。传统的标签排序算法基本只考虑了用户在标签上的行为以及在标签上的指标,没有充分考虑视频相关的信息。
(1)异质图构建模块,构建一个包括了视频、标签、媒体、用户以及他们之间交互的异质大图。这些异质的信息交互连接了在用户不同兴趣维度上相近的异质节点。
(2)网络表示学习模块,使用一个新的HFIN图神经网络模型,融合特征域维度的Transformer,GraphSAGE和FM特征抽取器得到节点表示。我们使用了一个基于邻居相似度的loss,将用户的多样偏好学到节点表示中。
(3)线上标签排序模块,使用学到的节点表示进行线上标签排序。GraphTR成功地从多种异质交互信息(特别是用户丰富的对视频的行为)中学习到了用户对于标签的偏好,从而极大地缓解了用户标签行为稀疏带来的问题,构建用户对视频的偏好和对标签的偏好之间的桥梁。
1、我们首次系统研究了标签增强的视频推荐这个新颖的推荐形式,同时提出了一个新的GraphTR框架。据我们所知,这是第一项在标签增强的视频推荐系统中的标签排序任务里引入异质图神经网络的工作。
2、我们提出了一种新的图神经网络模型,融合Transformer,GraphSAGE和FM特征抽取器得到节点表示。我们还提出了一个基于邻居相似度的loss,将用户的多样偏好学到节点表示中。
3、模型的线上线下效果均得到提升,同时我们也将模型部署到了微信看一看系统上,在真实场景里得到应用。
二、模型结构
(1)视频——视频,从用户的视频观看session行为中构建;
(2)视频——用户,从用户的视频观看行为中构建;
(3)视频——标签,从视频拥有的标签信息中构建;
(4)视频——媒体,从视频的所属视频来源中构建;
(5)标签——标签,从标签在视频中的的共现信息中构建。
这种邻居节点聚合方式强调了不同特征域之间和不同邻居之间的交互,能够促进用户多样化偏好之间的信息交互,从而使得用户的标签偏好能够更好地被学习。
我们通过HFIN得到节点表示之后,使用了一个基于邻居相似度的loss进行学习。由于用户在标签上的行为远比在视频上的行为稀疏(因为视频是标签增强的视频推荐系统中的核心推荐客体),仅仅使用用户在标签上的点击进行监督学习,往往难以使模型学习充分。因此,我们设计了一种基于邻居相似度的新的loss,希望能够通过用户的其它行为(特别是用户在视频上的行为),学习到用户在标签上的偏好。
具体地,我们认为在异质图上相邻的邻居需要有相似的表示(可以看作是一种步长为1的随机游走算法,步长为1缓解了传播噪声的影响)。这种loss的合理性在于,我们构建异质图时使用了多种视频、标签、用户、媒体之间的交互信息,这些交互信息连接的节点往往在用户某种偏好维度(例如社群、视频来源、类别等)上拥有相似点。
例如,视频session能够将在用户观看序列上相似视频(以及视频相关的标签、媒体号、用户等)联系到一起,反映了用户在视频观看序列上的偏好;媒体能够将一个媒体发布的视频联系到一起,反映了用户在视频来源上的偏好;用户也能将相似视频联系到一起,反映了同一类用户群体爱看的视频内容。通过邻居相似度的loss和异质图上的多步路径,在不同用户兴趣维度上相似的视频和标签,会被学习到拥有相似的向量。
三、实验结果
四、总结
微信AI
不描摹技术的酷炫,不依赖拟人的形态,微信AI是什么?是悄无声息却无处不在,是用技术创造更高效率,是更懂你。
微信AI关注语音识别与合成、自然语言处理、计算机视觉、工业级推荐系统等领域,成果对内应用于微信翻译、微信视频号、微信看一看等业务,对外服务王者荣耀、QQ音乐等产品。