【导读】第14届推荐系统顶级会议ACM RecSys在9月22日到26日在线举行。
最近官网大会公布了最佳长短文,包括来自Criteo AI Labs的因果嵌入推荐与德国Duisburg-Essen大学的用户评估中物品消费的影响。
官网地址: https://recsys.acm.org/best-papers/
最佳长论文奖
渐进式分层提取(PLE): 一种用于个性化推荐的新型多任务学习(MTL)模型
多任务学习(MTL)已成功地应用于许多推荐应用中。然而,在实际推荐系统中,由于复杂的竞争性任务相关性,MTL模型往往会出现负迁移的性能退化。此外,通过对SOTA MTL模型的大量实验,我们观察到一个有趣的现象,即一个任务的性能往往会通过损害其他任务的性能而得到改善。为了解决这些问题,我们提出了一个具有新的共享结构设计的渐进分层抽取(PLE)模型。PLE对共享组件和任务特定组件进行显式分离,采用渐进式路由机制逐步提取和分离更深层次的语义知识,提高了一般设置下跨任务联合表示学习和信息路由的效率。我们将PLE应用于复杂相关和正常相关的任务,在一个拥有10亿样本的真实腾讯视频推荐数据集上,从两任务到多任务,结果表明,在不同的任务相关性和任务组大小下,PLE显著优于最新的MTL模型。此外,在腾讯大型内容推荐平台上,对PLE的在线评价显示,与SOTA MTL模型相比,在浏览量和观看时间上分别增加了2.23%和1.84%,是一个显著的提升,证明了PLE的有效性。最后,在公共基准数据集上进行的大量离线实验表明,除了建议消除跷跷板现象外,PLE还可以应用于各种场景。PLE目前已成功部署到腾讯在线视频推荐系统中。
https://dl.acm.org/doi/10.1145/3383313.3412236
Best Long Paper Runner-up
通过叠加的方式将多个推荐系统集成在一起,可以有效地提高协同推荐的质量。最近的研究扩展了堆叠,使用了额外的用户性能预测器(例如,用户做出的评分总数)来帮助确定每个基础推荐应该在整体中贡献多少。然而,尽管手工制作判别预测器的成本很高,这通常需要深入了解每个推荐者在整体中的优缺点,但只观察到微小的改进。为了克服这一局限性,我们建议通过利用用户自己的历史评级来直接评估这些性能,而不是设计复杂的特征来预测给定用户的不同推荐器的性能。在来自多个领域的真实数据集上进行的实验表明,使用性能估计作为附加特征可以显著提高最先进的集成器的精度,nDCG@20比不使用它们平均提高23%。
https://dl.acm.org/doi/10.1145/3383313.3412264
最佳短论文
由于人们对隐私问题的日益关注,基于会话的推荐受到了越来越多的关注。尽管最近基于神经会话的推荐器取得了成功,但它们通常是以使用静态数据集的离线方式开发的。然而,推荐需要不断地适应以考虑新的和过时的项目和用户,并且需要在现实应用中“不断地学习”。在这种情况下,推荐器会不断地、周期性地更新,每次更新周期都会有新的数据到达,更新后的模型需要在下一个模型更新之前为用户活动提供推荐。用神经模型进行持续学习的一个主要挑战是灾难性遗忘,在这种情况下,一个经过持续训练的模型会忘记它以前学习过的用户偏好模式。为了应对这一挑战,我们提出了一种自适应提取样本回放(ADER)的方法,即通过自适应提取损失对当前模型周期性地回放以前的训练样本(即样本)。实验是基于最先进的SASRec模型,使用两个广泛使用的数据集,以几个著名的持续学习技术基准的ADER。我们以经验证明,ADER始终优于其他基线,甚至在每个更新周期中优于使用所有历史数据的方法。这一结果表明,ADER是一个很有前途的解决方案,可以缓解灾难性遗忘问题,从而构建更现实、更可伸缩的基于会话的推荐器。