【ACM Multimedia 2023】Diff4Rec: 基于扩散模型增强的序列推荐新范式

序列推荐旨在根据特定用户的一系列历史交互行为向用户推荐个性化的新交互项目，是当前互联网信息服务系统中广泛采用的推荐策略。然而，现有的序列推荐方法往往极大地受限于真实世界场景中的数据稀疏问题，尤其是冷启动等场景下，缺乏大量有效的用户交互行为，导致推荐系统无法充分挖掘用户意图，从而限制了推荐性能。
近日，来自清华大学以及央视频的研究团队，聚焦于序列推荐中的数据稀疏性问题，利用扩散模型的优势对序列推荐进行数据增强，提出了Diff4Rec框架，展示了实现高质量和鲁棒性推荐的潜力。该论文发表于ACM Multimedia 2023 (Brave New Ideas).

研究背景

一直以来，推荐系统往往极大地受制于数据稀疏性的影响：一方面，用户驻留时间短，提供的交互数据有限，导致显著的数据稀疏问题；另一方面，用户画像和社交关联的缺失给推荐系统带来了冷启动问题。为了解决这一问题，各类数据增强方法被提出，以增强数据样本的多样性，提高推荐系统的效率和适应性。
因此，在这一过程中，如何让模型生成符合用户意图的增广数据，并有效地应用于下游推荐任务，成为了至关重要的问题： (1) 一方面，如何充分将现有模型的生成能力用于推荐数据的增广，解决数据稀疏性； (2) 另一方面，如何避免潜在的噪声数据，将增广数据有效地输入推荐模型，同时增强用户交互行为和模型学习目标。

**序列推荐与数据增强 **** **

为了解决这一问题，我们提出了基于扩散模型增强的课程学习调度序列推荐方法Diff4Rec，在潜在空间中对用户-视频交互建模，生成增广样本，并从交互增强和目标增强层级使用扩散模型生成的样本，逐步实现交互序列的增强和序列推荐器的学习。

Diff4Rec方法

利用扩散模型增强用户-物品交互在当前研究中存在很大的空白，并提出了以下两个挑战： (1) 当前扩散模型多为图像生成而设计，其目的是捕捉视觉像素模式，而未必能为序列推荐实现数据增强。如何将扩散模型的学习能力整合到推荐领域中，并生成与用户意图一致的可靠交互是非常重要的。 (2) 给定特定的用户-物品交互增强扩散模型，如何确保扩散过程生成的数据始终有利地作用于序列推荐，同样也需要精心的设计。
为了解决以上问题和挑战，Diff4Rec采用两阶段设计，首先利用扩散模型在潜在空间中对用户-物品交互建模，生成增广样本，然后通过课程调度策略，从交互增强和目标增强两个层级利用扩散模型生成的样本，学习序列推荐器。

Diff4Rec框架

具体而言，我们针对推荐任务设计了一个扩散模型来逐步破坏和恢复用户-物品交互，并将其编码到一个潜在空间中，以压缩复杂信息并捕获潜在的用户意图： . 其中，扩散模型前向过程通过加入高斯噪声逐渐破坏用户交互向量： . 反向过程对损坏的潜在向量去噪，并重建原始交互向量：由预训练的扩散模型生成的增强样本随后通过课程学习调度程序进行评估，并逐步输入到序列推荐器中。为了有效利用扩散生成的样本，增强分为交互增强和目标增强两个层次。交互增强 (Interaction Augmentation)：使用生成的样本来丰富历史序列，揭示多样化和未被发现的用户意图。对于第个用户的历史序列，通过替换和重新排序操作获得增广序列。目标增强 (Objective Augmentation)：利用生成的样本作为增强训练目标的候选项，从而获得更好的参数优化和模型性能。利用增广序列训练序列推荐器，其中增强后的训练目标为：