KDD2022 | 快手短视频多样性推荐算法揭秘, 相关推荐新SOTA

2022 年 8 月 12 日 机器学习与推荐算法

前两天刚好刷到KDD2022的一篇文章,是介绍快手在它们短视频上的一项推荐重排新算法,不仅在用户观看时长和视频播放量都有了较大提升外,用户观看视频的标签数也有了显著增长,这说明该算法同时兼具相关性和多样性两点

那什么是相关性和多样性呢?

下图是快手的短视频推荐:左图是一个包含了三个特征标签(例如日落、火车和大海)的视频,在用户点击了喜欢后,会产生右图含有几个相关视频的推荐页面。

这个例子阐述的就是“相关推荐”的应用场景。除了相关性,短视频推荐还要具有一定的多样性,以避免信息茧房。

为了测试其效果,我顺便下载了一下快手这款app,于是就出现了下图的场景:左图是用户冷启动推给我的第一个短视频,一个穿着短裙的小姐姐,紧接着第二个短视频就是右图的另一位小姐姐,而后面的几个短视频也出现了电影、美食等其它方向,探索和利用(Exploit&Explore做得都很不错,大家可以去快手上体验一下。

快手提出的这款新算法叫FDSB,是一款通用的重排序框架,利用用户物品的偏好得分用户物品基于不同特征的相关性、多样性得分从而对推荐列表中的物品重排序。

实验结果来看,FDSB在用户观看时间和视频播放方面取得了显著的改进,这表明用户粘性得到了提高;其次,用户观看视频的标签数量增加也说明FDSB可以推荐更多样性的视频。

下面就带大家一起领略这个算法的奇妙之处~

论文标题:Feature-aware Diversified Re-ranking with Disentangled Representations for Relevant Recommendation

论文来源:快手&人大,KDD2022

论文链接:https://arxiv.org/abs/2206.05020

一、FDSB核心思想

本文由快手和人大发表于KDD2022上。在具体看论文模型细节之前,我们来看一下相关推荐的任务描述。由于要关注用户兴趣、相关性与推荐物品的多样性,我们可以自然而然地为相关推荐写出目标排序公式:

其中,用户偏好得分我们可以利用现有模型计算得到。 困难在于后面两项: 相关性和多样性。 为模型中引入特征这一重要因素,我们将相关性和多样性定义为:
如上分析,可以将相关推荐的多样化再排序描述为一个基于物品embedding和特征的组合优化问题。 由于这是一个NP-hard问题,采用贪心算法 ,将整体目标分解为单个物品目标:

二、算法细节

要点一:如何处理物品特征冗余问题?
由于物品的特征信息 可以从不同潜在方面描述该物品的特性,基于解耦的思想,我们可以将这些特征,根据所描述物品的不同方面分解为不同的表示 。我们将 称之为对应于物品不同方面的细粒度特征感知表示,后统称为分离表征。
为了学习分离表征,论文采用一种基于多头自注意力机制的方法DAE。具体地,以物品原始特征作为value,以物品embedding与特征的投影向量作为query和key来计算注意力分数,具体公式为:
这些分离表征反映了物品的部分特征,因此应该接近物品的整体embedding表示。具体地,采用MSE与InfoNCE两种alignment loss来提取从物品embedding到具体特征分离表示中的信息
其中, 。我们还记得,物品的分离表征可以从不同的潜在方面反映该物品的特性。而为了实现从解耦的不同潜在方面中能够捕获不同的语义特征,再引入orthogonalization loss
我们知道物品的相关性和多样性本质上是相互矛盾的,即多样性更强时,相关性就更弱。然而我们的相关推荐既要保证所推荐的物品与触发物品之间的相关性,又要保证一定的多样性。因此当多样性表现得更强时,我们应该提高相关性的权重,反之亦然,从而实现二者的平衡。
要点二:在相关推荐中,应该如何实现物品之间的相关性与多样性的平衡?
为了在二者之间达成一个平衡,论文设计了一种相关性-多样性相关权重机制,我们为两个性质分别引入两个可学习的系数向量,即:
其中, 为累计相关性。我们的目标是为用户选择 个相关物品,具体地,采用Greedy Selection的方案对推荐列表中的物品进行再排序
当选定第一个物品时,由于没有其他备选物品,所以不需考虑与备选物品间的多样性问题,这里只用计算单物品的相关性得分,即:
当已选物品数量大于1时,则需要计算相关性和多样性得分:
其中,多样性函数遵循MMR方法,即,减去所选物品和候选物品之间的最大相似度作为多样性得分。
模型的完整算法为
模型的复杂度与普通MMR相当,其中时间复杂度为 ,空间复杂度为

三、实验结果

3.1 一个关于分离表征的案例解析
为了说明FDSB是如何将物品特征分解为不同方面的,论文的实验部分给出一个有趣的案例分析:随机抽取一段视频,将每个特征解耦得到的方面的注意力权重可视化,如下图。
从图中,我们可以看到,视频的特征根据语义的不同被分解为了不同方面,第一个方面侧重于抽象特征,如“动物”和“野生动物”;第二个方面捕捉了更加细粒度的信息,如“大熊猫”和“熊猫”;第三个方面则提取了一些不寻常的特征,如图中的“Metal Eater”为“吞金兽”,是熊猫的昵称。还有一个”pets“是视频中的多余标签,并没有被所有的方面捕捉到。
这个例子定性地说明了论文所提出的 DAE模型在学习分离表征方面的有效性
3.2 在线部署和A/B测试
为了进一步验证FDSB的有效性,该模型被部署在在线快手APP的”更多相关视频“功能上以验证整个工作流程。其中,采用视频标签作为特征。具体的工作流程如下图:
在快手的实际应用场景中从(1)观看时间,(2)视频播放和(3)观看的视频标签三个指标评估该框架的性能,前两个指标反映用户的满意度,第三个指标通常用于多样性。
具体的结果如开篇描述,FDSB不仅可以提升用户忠诚度,也可以推荐更多相关视频。
3.3 实验结果
与多个模型对比,可以看出FDSB的效果提升显著, 在Recall与MRR分别提升了25.2%与18.3% 。此外,在相关性的评估指标和多样性的评估指标中效果也不错。

四、总结

论文提出了一种用于相关推荐的基于分离特征的再排序框架FDSB。模型具体包含两个部分:(1)用于实现特征分离的自注意力方法DAE;(2)一种用于平衡候选物品相关性与多样性的策略。模型具有一定的新颖性且效果不错,大家不妨可以参考一下它的核心思想与网络结构。
文末提出两个问题供大家思考:
  • 除了文中所提的物品特征,是否有更好的辅助信息可以将触发物品与推荐多样性结合起来?
  • 你认为基于特征感知的细粒度推荐在其他推荐场景中是否有应用前景?以及,是否有其他高效的基于特征的分离表征解耦方法?

欢迎干货投稿 \ 论文宣传 \ 合作交流

推荐阅读

SIGIR2022 | 基于领域交互的点击率预估模型
CIKM2022 | 推荐系统中检索模型的可定制损失函数
论文周报 | 推荐系统领域最新研究进展

由于公众号试行乱序推送,您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容, 请将本号设为星标,以及常点文末右下角的“在看”。

喜欢的话点个在看吧👇
登录查看更多
0

相关内容

华为朱杰明:预训练模型在信息流推荐中的应用与探索
专知会员服务
17+阅读 · 2022年5月23日
专知会员服务
16+阅读 · 2021年9月18日
专知会员服务
24+阅读 · 2021年8月3日
【WWW2021】 大规模组合K推荐
专知会员服务
43+阅读 · 2021年5月3日
专知会员服务
58+阅读 · 2021年4月29日
专知会员服务
36+阅读 · 2021年4月18日
专知会员服务
33+阅读 · 2020年11月18日
内推 | 快手推荐算法工程师招聘
机器学习与推荐算法
1+阅读 · 2022年9月1日
KDD2022 | 基于自监督超图Transformer的推荐算法研究
机器学习与推荐算法
1+阅读 · 2022年8月26日
基于对抗学习的隐私保护推荐算法
机器学习与推荐算法
0+阅读 · 2022年7月26日
SIGIR2022 | 基于森林的深度推荐算法
机器学习与推荐算法
0+阅读 · 2022年7月18日
QQ音乐推荐召回算法的探索与实践
专知
0+阅读 · 2022年4月4日
都是推荐系统,广告算法和推荐算法有啥区别?
机器学习与推荐算法
0+阅读 · 2022年2月9日
Attention机制在深度推荐算法中的总结
机器学习与推荐算法
0+阅读 · 2021年9月15日
推荐召回算法之深度召回模型串讲
AINLP
22+阅读 · 2019年6月14日
【推荐系统】详解基于内容的推荐算法
产业智能官
23+阅读 · 2018年1月11日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年11月27日
Arxiv
0+阅读 · 2022年11月26日
Arxiv
15+阅读 · 2021年6月27日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
华为朱杰明:预训练模型在信息流推荐中的应用与探索
专知会员服务
17+阅读 · 2022年5月23日
专知会员服务
16+阅读 · 2021年9月18日
专知会员服务
24+阅读 · 2021年8月3日
【WWW2021】 大规模组合K推荐
专知会员服务
43+阅读 · 2021年5月3日
专知会员服务
58+阅读 · 2021年4月29日
专知会员服务
36+阅读 · 2021年4月18日
专知会员服务
33+阅读 · 2020年11月18日
相关资讯
内推 | 快手推荐算法工程师招聘
机器学习与推荐算法
1+阅读 · 2022年9月1日
KDD2022 | 基于自监督超图Transformer的推荐算法研究
机器学习与推荐算法
1+阅读 · 2022年8月26日
基于对抗学习的隐私保护推荐算法
机器学习与推荐算法
0+阅读 · 2022年7月26日
SIGIR2022 | 基于森林的深度推荐算法
机器学习与推荐算法
0+阅读 · 2022年7月18日
QQ音乐推荐召回算法的探索与实践
专知
0+阅读 · 2022年4月4日
都是推荐系统,广告算法和推荐算法有啥区别?
机器学习与推荐算法
0+阅读 · 2022年2月9日
Attention机制在深度推荐算法中的总结
机器学习与推荐算法
0+阅读 · 2021年9月15日
推荐召回算法之深度召回模型串讲
AINLP
22+阅读 · 2019年6月14日
【推荐系统】详解基于内容的推荐算法
产业智能官
23+阅读 · 2018年1月11日
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员