扩散模型推荐系统综述

在线服务的快速发展使推荐系统（RSs）成为缓解信息过载并在电子商务、娱乐和社交媒体平台上提供个性化内容的重要工具。尽管传统推荐技术在过去几十年中取得了显著进展，但它们仍然因诸如协作信号不足、潜在表示薄弱以及数据噪声等因素导致的泛化性能有限而受到影响。为应对这些问题，扩散模型（DMs）因其强大的生成能力、坚实的理论基础以及相比于其他生成模型技术（如变分自编码器（VAEs）或生成对抗网络（GANs））更高的训练稳定性，逐渐成为推荐系统中的潜力解决方案。因此，本文首次对推荐系统中的扩散模型进行了全面综述，并从实际推荐系统全流程的角度提出了整体鸟瞰视图。我们系统地将现有研究工作分为三个主要领域：（1）扩散用于数据工程与编码，侧重于数据增强和表示增强；（2）扩散作为推荐模型，利用扩散模型直接估计用户偏好并对项目进行排序；（3）扩散用于内容呈现，使用扩散模型生成个性化内容，如时尚设计和广告创意。我们的分类法突出了扩散模型在捕捉复杂数据分布和生成高质量、多样化样本方面的独特优势，这些样本能够与用户偏好高度一致。我们还总结了将扩散模型应用于推荐系统的核心特点，并进一步识别了未来探索的关键领域，这有助于为研究人员和实践者通过创新性地应用扩散模型推进推荐系统的研究提供路线图。为进一步促进基于扩散模型的推荐系统研究社区，我们积极维护一个GitHub仓库，用于存储相关论文和其他资源。引言

随着在线服务的快速发展，推荐系统（RSs）在缓解信息过载问题 [19, 31, 85] 及满足用户信息需求 [36, 80] 方面变得越来越不可或缺。它们在电影 [35]、电子商务 [112]、音乐 [118] 等各种场景下提供个性化推荐。尽管推荐任务形式各异（如序列推荐、Top-N 推荐），但推荐系统的共同目标是根据多种来源数据（如交互数据、用户画像、项目内容）准确估计给定用户对每个候选项目的偏好，并最终生成向用户展示的排序列表 [79, 141]。 如图 1 所示，过去几十年中，推荐系统的研究取得了显著进展，从传统的协同过滤（CF）技术 [41] 转向了更先进的深度学习方法 [83]。然而，这些方法通常因协作信号不足 [80]、潜在表示薄弱 [27] 和数据噪声场景 [129] 等因素，导致泛化性能有限。因此，生成模型，如变分自编码器（VAEs）[57, 108] 和生成对抗网络（GANs）[7, 34, 56]，因其生成特性和坚实的理论基础，成为缓解上述推荐挑战的有前途的解决方案。然而，这些模型仍存在自身的局限性，如表示能力受限 [133] 和训练不稳定性 [5]。近年来，扩散模型（DMs）[42, 119] 已成为生成模型领域的最新前沿，并在计算机视觉 [91]、音频生成 [63]、自然语言处理 [3] 和强化学习 [167] 等多个领域取得了显著成功。与早期的生成模型（如VAEs和GANs）不同，扩散模型利用去噪框架，逆转多步加噪过程，从而生成与训练数据分布紧密对齐的合成数据。这确保了扩散模型在捕捉多粒度特征表示和生成高质量样本方面的卓越能力，同时保持了更高的训练稳定性。因此，如图 1 所示，越来越多的前沿尝试已将扩散模型应用于推荐系统，显著提高了不同典型推荐过程的性能，如数据增强 [135]、用户建模 [162] 和内容个性化 [148] 等。我们总结了扩散模型在推荐系统背景下具有吸引力的三个主要特征：(1) 杰出的生成能力。作为最先进的生成范式之一，扩散模型能够有效捕捉源数据的底层分布，完成各种生成任务，以辅助下游推荐任务，如数据填补 [164]、用户行为模拟 [87]、样本合成 [151] 和图像生成 [148]。(2) 优越的表示学习。扩散模型以概率生成的方式，能够学习到源数据的高质量、低维表示 [32, 150]。在推荐系统的背景下，它们能够有效地基于多模态数据（如交互数据、复杂用户行为、项目属性）捕捉底层的潜在因子和表示，从而更准确地预测用户偏好，并生成针对个体口味的推荐。(3) 灵活的内部结构。作为通用的生成模型学习框架，扩散模型的内部结构（即主干设计）相当灵活，可以与其他深度学习模型（如U-Net [42] 和 Transformers [106]）结合。这使得扩散模型能够灵活设计主干结构，以有效地将不同类型的异构信息（如用户人口统计、时间动态和上下文提示）纳入推荐过程。鉴于扩散模型在推荐系统中的应用优势，以及研究界的相关研究快速发展，我们认为现在是时候进行一项全面的综述，以系统总结当前的研究进展，并为未来的探索提供灵感，特别是关于扩散模型在推荐系统中的适应性应用。 扩散模型与生成建模和自监督学习密切相关。已经有几篇相关的综述工作深入探讨了生成模型 [21, 22, 65, 71, 76, 144, 157] 或自监督学习技术 [52, 86, 155] 在推荐系统中的潜力。例如，Liu等人 [86] 和 Yu等人 [155] 回顾了基于自监督学习（SSL）的推荐技术，如对比学习和序列建模。Deldjoo等人 [22] 聚焦于对抗性推荐系统，其中生成对抗网络（GANs）被广泛应用于安全性和鲁棒性。Liang等人 [76] 调查了变分自编码器（VAEs）在推荐系统中的应用，基于其生成贝叶斯的特性。还有一些综述 [21, 65, 71, 144] 重点关注在大语言模型（LLMs）辅助下的生成推荐，这些模型在过去几年中已成为各种下游场景中最受欢迎的基础模型。然而，这些综述中没有一个集中探讨扩散模型在推荐系统中的应用。我们仍然缺乏对推荐系统如何拥抱扩散模型并将其集成到推荐流程的不同部分的全景视角，而这对构建技术路线图，以系统指导扩散模型赋能的推荐系统的研究和工业实践至关重要。 为此，本文旨在进行一项及时且全面的综述，重点研究扩散模型在推荐系统中的适应性应用。如图3所示，我们分析了最新的研究进展，并根据扩散模型在现代基于深度学习的推荐系统流程中所扮演的不同角色，分类现有的工作：

扩散用于数据工程与编码。数据工程与编码通常指将在线收集的原始数据转换为结构化数据或神经嵌入，以供下游推荐器使用。作为一类强大的生成模型，扩散模型在数据增强和表示增强方面表现出了显著的能力，这两者都有助于提高下游推荐性能。
扩散作为推荐模型。推荐器旨在估计给定用户对每个候选项目的偏好，最终生成向用户展示的排序列表。根据推荐器要解决的不同任务类型，我们将基于扩散模型（DM-based）的推荐器分为三类：协作推荐、上下文感知推荐和跨域推荐。
扩散用于内容呈现。借助扩散模型，我们可以从个性化推荐进一步迈向个体化内容生成。即每个单一项目可以获得由扩散模型为不同用户或群体生成的不同呈现内容（如创意、缩略图），从而大大提高用户满意度。

基于上述分类法，我们可以识别出这个快速演变的领域中的新兴趋势，并因此提出可行且具有启发性的建议，帮助现有在线推荐平台借助扩散模型实现演进。本文的主要贡献可以总结为以下几点：

全面且最新的综述。据我们所知，这是第一篇关于扩散模型在推荐系统中应用的全面、最新且前瞻性的综述。我们的综述突出了扩散模型对推荐系统的适用性，并从多个方面讨论了它们带来的优势，从个性化推荐到个体化内容呈现。
统一且结构化的分类法。我们引入了一种组织良好的分类方法，将现有的研究工作根据扩散模型在不同推荐流程中的角色划分为三大类：扩散用于数据工程与编码、扩散作为推荐模型、扩散用于内容呈现。此分类法为读者提供了一个连贯的路线图，帮助他们从多个角度认识扩散模型在推荐系统中的应用趋势。
对挑战和未来方向的洞察。我们强调了当前研究领域面临的关键挑战，并进一步指出了未来探索的几个有前途的方向，旨在为扩散模型赋能的推荐系统提供启示，并吸引更多研究人员投身于这一研究领域。

本文其余部分的组织结构如下：第2节简要介绍推荐系统和扩散模型的背景和预备知识。第3节我们通过分类现有工作，详细说明了扩散模型在推荐中的分类法。第4节我们重点讨论现有工作中的局限性和挑战，并探讨潜在的未来方向。最后，第5节我们对本文进行了总结。专知便捷查看，访问下面网址或点击最底端“阅读原文”

****https://www.zhuanzhi.ai/vip/9dcf45a53259c483e9ab51efb4835006