近年来,基于会话的推荐方法受到学术界的广泛关注。随着深度学习技术的不断发展,不同的模型结构被 应用于基于会话的推荐方法中,如循环神经网络、注意力机制、图神经网络等。该文对这些基于会话的推荐模型进 行了详细的分析、分类和对比,阐明了这些方法各自解决的问题与存在的不足。具体而言,该文首先通过调研,将 基于会话的推荐方法与传统推荐方法进行比较,阐明基于会话的推荐方法的主要优缺点;其次,详细描述了现有的 基于会话的推荐模型如何建模会话集中的复杂数据信息,以及这些模型方法可解决的技术问题;最后,该文讨论并 指出了在基于会话推荐的领域中存在的挑战和未来研究的方向。

随着大数据时代的到来,互联网的规模日益庞 大,这为用户带来极其丰富且复杂的信息,使得用户 能方便、快捷地获取信息。然而,面对海量的信息, 用户往往不能迅速地获取自己需要的内容,导致对 信息的使用效率有所下降,也就是所谓的信息超载 (InformationOverload)[1]。解决信息超载问题,目 前有两个常用的方法,一是搜索引擎,二是推荐系 统。推荐系统根据用户的个人信息或历史行为来学 习用户的兴趣偏好,并为用户生成其感兴趣的推荐 序列。目前,推荐系统应用于许多领域[2],例如,电 子商 务[3]、新 闻 推 荐[4-5]、音 乐 推 荐[6]以 及 位 置 服 务[7]等。传统推荐方法主要包括两种:一是基于内 容的推荐方法,二是基于协同过滤的推荐方法。基于内容的推荐方法[8]是根据用户(User)的 兴趣简介与项目(Item)的特征描述实现推荐。其 中,用户的兴趣简介也就是用户的兴趣偏好,它可以 来源于用户主动输入,但往往是从用户与过去项目 交互中获得的;项目的特征描述可以是项目的描述 或用户对该项目的评论。基于内容的推荐方法在一 定程度上可以解决冷启动(Cold-Start)问题[9]。同 时,基于内容的推荐方法具有很好的可解释性,但基 于内容的推荐方法在项目的特征提取上存在一定难 度,且难以挖掘出用户的潜在兴趣偏好。

基于协同过滤的推荐方法是基于用户或项目间 的相关性进行推荐的方法,主要可以分为两类,即基 于用户的协同过滤以及基于项目的协同过滤。基于用 户的协同过滤,也可称为 K-NN(K-NearestNeighbor) 协同过滤,其核心思想是根据用户的历史行为找到 与当前用户行为偏好相似的用户,然后为该用户推 荐这些相似用户感兴趣的项目。基于项目的协同过 滤的方法关注的不是用户之间的相似性,而是项目 之间的关联性,也就是说,若两个项目被相同的用户 喜欢或不喜欢,那么这两个项目是相关的,系统为用 户推荐相关的项目[10]。基于协同过滤的推荐方法 能够挖掘出用户的潜在兴趣,帮助用户发现新的兴 趣,提高推荐的质量,但是其难以解决冷启动问题; 同时,基于协同过滤的推荐方法受到数据稀疏性的 影响,随着数据量的增大,数据的稀疏性也随之增大 (如一个用户只与所有项目中的几个有交互),这就 使得计算最邻近(最相似)用户或项目的准确率降 低,影响最终推荐结果。

以上传统的推荐方法各有优缺点,随着互联网 规模的增大,数据量也越来越大,传统推荐方法的不 足也越来越明显。除了它们各自的缺点外,传统推 荐方法存在的共同点是:只能够考虑用户长期静态 偏好,而忽略了用户兴趣随时间的变化。因而出现 了序列 推 荐 (SequentialRecommendation)[11]。这 一类专注于行为序列性的推荐模型,通过对用户历 史行为的序列化建模,学习用户的兴趣,进而对用户 进行相关推荐。随着序列推荐的深入研究,其弊端也开始出现, 即:偏向于长期兴趣的学习,而忽略了用户短期内 偏好的转移,使得用户在某一段时间内的兴趣变化 被其历史交互行为所掩盖,从而生成不可靠的推荐 结果。产生这个问题的原因是忽略了用户行为的事 务性结构,例如用户之前长期购买牛仔裤,某一时段 突然喜欢运动裤,但由于用户购买的牛仔裤历史记 录远远多于运动裤,使推荐系统认为用户的偏好仍 为牛仔裤。在此背景下,将用户行为分解成更小的 粒度,考虑用户行为的事务性结构,捕捉用户短期偏 好的转移是十分有必要的,因此基于会话的推荐系 统(Session-BasedRecommendationSystem,SBRS) 得到了快速的研究和发展.

基于会话的推荐方法是将用户的全局交互行为 分割成一个个更小粒度的事务单元,每个事务单元 是由用户的部分交互行为组成的,这些事务单元被 称为会话[12-13]。会话可以在不同的场景中表现出 不同的含义,例如,在电子商务领域,会话可以是用 户一次购买的物品,或一小时内添加到购物车的商 品;在旅游场景,会话可以是用户一年内游玩的景 点;另外,会话也可以是用户一小时内浏览的网页、 一天内看的电影等。基于会话的推荐算法通过学习 这些会话内以及会话间项目的依赖关系,挖掘出用 户的兴趣偏好,并为用户生成其感兴趣的推荐列表。如图1所示,用户的购物行为构成用户与项目的交 互序列,其中,U 表示用户、V 表示项目、S 表示会 话。在传统的推荐方法中往往通过全局的项目序列 来挖掘用户兴趣,而在基于会话的推荐系统中,用户 的购物行为会根据购物的次序将用户行为分割成粒 度更小的会话,以这种方法保留用户行为的事务结 构,获取用户行为中更多的转换信息和依赖关系;基 于会话的推荐方法不仅仅关注用户最新的交互行 为①,同时包括当前会话中其他项目②以及历史会话对当前推荐结果的影响,这种只需要根据会话中物 品依赖关系进行推荐的特性,使其能够为匿名用户 进行推荐。总的来说,基于会话的推荐方法以会话 作为基本单元,不仅能够捕捉更多的项目间的转换 信息和依赖关系,还能聚焦于当前会话,适时捕捉到 用户兴趣的变化,从而改善推荐的效果。

基于会话推荐方法解决了传统推荐系统只关 注用户长期 静 态 偏 好、无 法 及 时 发 现 用 户 兴 趣 变 化的问题。但 是,基 于 会 话 的 推 荐 方 法 仍 存 在 一 些问题,例如,基于会话的推荐方法难以捕捉用户 长期静态偏好。表1在输入、核心思想、优点与缺 点等方面,将 传 统 的 推 荐 方 法 与 基 于 会 话 的 推 荐 方法进行了 对 比,能 直 观 地 表 现 出 各 类 推 荐 方 法 的优势与不足。

针对基于会话推荐方法存在的问题,许多学者 开展了深入的研究。近年来,深度学习的发展为基 于会话的推荐方法带来了机遇。随着深度学习在自 然语言处理、语音识别、图像识别等多个领域的突破 性进展,循环神经网络(RecurrentNeuralNetwork, RNN)、图 神 经 网 络 (Graph Neural Networks, GNN)等深度学习模型被应用于基于会话的推荐算 法中。目前,随着新技术的不断发展,国内外的基于 会话的推荐领域的综述性文章[12]较少,且这些文章 并未对目前已提出的方法和已解决的问题进行详细 的对比、分析和总结。因此,一篇详细归纳和总结在 基于会话的推荐领域已取得的进展的综述文献十分 必要。本文对基于会话的推荐方法进行了详细、全 面的调研,对已有的研究成果进行梳理,以期对从事 推荐算法和系统的理论研究及实践开发人员提供参 考和启发。

2. 基于会话推荐方法的分类

近年来,基于会话的推荐方法发展迅速,众多学 者提出了大量的模型和方法,本节从技术角度对基 于会话的推荐方法进行分类。首先介绍如协同过 滤、矩阵分解、马尔科夫链等的传统会话推荐方法; 进而介绍基于深度学习的会话推荐方法,包括循环 神经网络、注意力机制、图神经网络等,最后介绍基于强化学习的会话推荐方法.

2.1 传统的会话推荐方法

2.1.1 基于协同过滤的会话推荐方法 协同过滤[14]是传统的推荐系统中常用的方法, 其主要包括两种算法:基于用户的最邻近算法[15] 和基于项目的最邻近算法[16]。

2.1.2 基于矩阵分解的会话推荐方法 推荐方法往往是通过分析用户的历史交互数据 来挖掘用户偏好,通常这些数据包含两种类型:用 户和项目。这些数据可以构成一个矩阵,一维代表 用户,另一维代表用户感兴趣的项目。但由于大多 数用户只与少量项目交互,因此该矩阵是比较稀疏 的,单纯依赖这种稀疏矩阵去产生推荐的正确率是 十分低下的。矩阵分解通过补充隐式反馈信息构造 一个相对稠密的矩阵,然后将用户和项目映射到同 一潜在向量空间中,使得每一个用户u 都对应一个 潜在的向量qu,每一个项目v 都对应一个潜在向量 pv,此 时,用 户 u 对 项 目v 的 评 分ru,v 可 表 示 为 式(4),即用户的潜在向量qu 表示与项目的潜在向 量表示pv 的点乘。

2.1.3 基于马尔科夫链的会话推荐方法 协同过滤为了寻找用户或项目的邻居,往往过 于依赖用户与系统的历史交互数据,尤其是用户对 项目的评级(评分)信息,但是忽略了用户与项目交 互的顺序性。例如,用户在浏览商品时,用户的点击 浏览操作是有次序的(一个商品到另一个商品),协 同过滤无法对这种顺序行为进行建模,从而无法挖 掘出用户行为的序列模式。

2.2 基于深度学习的会话推荐方法

随着算力的不断提升和深度学习的不断发展, 越来越多的科研人员将深度学习应用到基于会话的 推荐方法中,并取得了一系列的成果。基于深度学 习的会话推荐方法不仅能够分析数据间的显式联 系,还能够学习到用户、项目等数据的隐式特征,生 成表达能力强大的嵌入表示,进行更可靠的推荐。不同的深度学习模型被应用于基于会话的推荐 系统中来解决不同的问题。例如,会话集常按照时 间戳或用户实际的交互顺序来进行分割,会话集中 的会话往往具有序列关系,同时,会话中的项目也具 有顺序关系,因此对序列关系敏感的循环神经网络 被应用于基于会话的推荐方法中。传统的推荐方法 往往只能够考虑到用户的长期偏好,而基于会话的 推荐方法将用户行为分割成更小粒度的会话集,通 常只能聚焦于用户的短期偏好。为了使基于会话的 推荐方法既能考虑用户的长期偏好也能够关注用户 的短期偏好,注意力机制被应用其中;图神经网络能 够建模会话集中复杂的项目转移关系,从而学习出 表达能力极强的项目嵌入表示,在基于会话的推荐 方法中广泛应用。后文将根据模型类别对已有的推 荐方法进行分类总结,并对各类方法进行详细对比。

2.3 基于强化学习的会话推荐方法

会话推荐通常以自监督进行训练,给定会话序 列,计算下一项推荐。这种训练模式可能会根据项 目相关性找出最优的结果,但是对于用户来说有可 能还有其他需求。近年来,推荐结果多样性和新颖 性的重要程度逐渐提高,因为推荐多样化的项目更 有可能符合用户的实际需求。为了针对上述多个目标优化推荐系统,通常需 要用可微函数进行优化,然而在目标只能以不可微 的形式 呈 现 的 领 域 难 以 使 用 多 目 标 优 化 (MultiObjectiveOptimization,MOO)。为了解决这一问 题,Stamenkovic等人[61]使用强化学习(ReinforcementLearning,RL)的策略,引入了标量化多目标强 化 学 习 (Scalarized Multi-Objective Reinforcement Learning,SMORL)方法。SMORL 使用单个强化 学习智能体(Agent)同时满足三个可能相互冲突的 目标:提高点击率,使推荐多样化,以及引入新项 目。该模型专注于选择的奖励,同时保持高相关性 排名性能。

3 数据优化及数据集

基于会话的推荐方法与传统推荐方法或序列推 荐方法[11]的不同点也体现在数据结构上,基于会话 的推荐方法是以会话作为数据的基本单元。会话是 用户行为被分解后形成的一个个有序项目组,在会 话间不仅能够找到项目序的关系,也能够聚焦于用 户行为的事务特性①。在深度学习被应用于基于会话的推荐领域初 期,由于训练数据存在一些问题,导致最终的推荐效 果并不是十分理想。因此,许多学者在数据预处理、 排名损失函数[62]等方面进行了优化。其中较为典 型的是 Tan等人[63]提出的优化策略。

4 基于会话的推荐方法未来研究方向

近年来,基于会话的推荐方法快速发展,众多学 者针对已存在的问题提出了不同的模型方法,如上 文提到的利用循环神经网络挖掘会话中项目的序列 模式、利用图神经网络建模项目间复杂的转换关系 等。但目前对于基于会话的推荐方法的研究仍处于 初级阶段,仍存在一些挑战,这些挑战是未来值得研 究的方向。本节将针对基于会话的推荐方法可能面 临的挑战进行阐述。(1)基于会话的推荐中的长期偏好;(2)用户多行为联合推荐; (3)下一个会话的推荐; (4)跨域会话推荐

5 结论

本文对基于会话的推荐方法进行了详细地调 研。首先分析了传统推荐方法的优劣势,针对其只 能学习用户长期偏好的问题,阐明了基于会话的推 荐方法捕捉用户短期偏好的重要意义,并详细介绍 了基于会话推荐方法的工作原理和目标。其次,本 文对当前已有的基于会话的推荐算法进行了分类总 结,对比了基于不同模型下的推荐方法的优劣势,并 详细介绍了这些模型方法的工作原理,如基于循环 神经网络的会话推荐方法建模会话中项目的序列模 式,基于注意力机制的会话推荐方法捕捉用户当前 的主要意图,以及基于图神经网络的会话推荐方法 建模会话上下文项目的转换等。最后,针对基于会 话的推荐方法可能面临的挑战和有潜力的研究方向 进行了说明。

成为VIP会员查看完整内容
29

相关内容

基于图学习的推荐系统研究综述
专知会员服务
89+阅读 · 2022年9月17日
协同过滤推荐系统综述
专知会员服务
47+阅读 · 2021年11月4日
基于强化学习的推荐研究综述
专知会员服务
84+阅读 · 2021年10月21日
专知会员服务
57+阅读 · 2021年8月12日
专知会员服务
61+阅读 · 2021年3月25日
专知会员服务
42+阅读 · 2021年3月21日
多模态视觉语言表征学习研究综述
专知会员服务
192+阅读 · 2020年12月3日
基于知识图谱的推荐系统研究综述
专知会员服务
329+阅读 · 2020年8月10日
新人友好,「图学习推荐系统」中文综述
图与推荐
2+阅读 · 2022年9月21日
「图学习推荐系统」最新2022综述
专知
5+阅读 · 2022年9月18日
最新综述 | 基于因果推断的推荐系统
机器学习与推荐算法
3+阅读 · 2022年9月1日
350篇文献总结可信推荐系统前沿进展
机器学习与推荐算法
0+阅读 · 2022年7月30日
综述 | 推荐系统偏差与去偏总结
机器学习与推荐算法
3+阅读 · 2022年5月11日
【综述】基于知识图谱的推荐系统综述
AINLP
14+阅读 · 2020年7月7日
AI综述专栏 | 跨领域推荐系统文献综述(上)
人工智能前沿讲习班
13+阅读 · 2018年5月16日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
【推荐系统】融合 MF 和 RNN 的电影推荐系统
产业智能官
23+阅读 · 2018年1月4日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
164+阅读 · 2023年4月20日
VIP会员
相关VIP内容
基于图学习的推荐系统研究综述
专知会员服务
89+阅读 · 2022年9月17日
协同过滤推荐系统综述
专知会员服务
47+阅读 · 2021年11月4日
基于强化学习的推荐研究综述
专知会员服务
84+阅读 · 2021年10月21日
专知会员服务
57+阅读 · 2021年8月12日
专知会员服务
61+阅读 · 2021年3月25日
专知会员服务
42+阅读 · 2021年3月21日
多模态视觉语言表征学习研究综述
专知会员服务
192+阅读 · 2020年12月3日
基于知识图谱的推荐系统研究综述
专知会员服务
329+阅读 · 2020年8月10日
相关资讯
新人友好,「图学习推荐系统」中文综述
图与推荐
2+阅读 · 2022年9月21日
「图学习推荐系统」最新2022综述
专知
5+阅读 · 2022年9月18日
最新综述 | 基于因果推断的推荐系统
机器学习与推荐算法
3+阅读 · 2022年9月1日
350篇文献总结可信推荐系统前沿进展
机器学习与推荐算法
0+阅读 · 2022年7月30日
综述 | 推荐系统偏差与去偏总结
机器学习与推荐算法
3+阅读 · 2022年5月11日
【综述】基于知识图谱的推荐系统综述
AINLP
14+阅读 · 2020年7月7日
AI综述专栏 | 跨领域推荐系统文献综述(上)
人工智能前沿讲习班
13+阅读 · 2018年5月16日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
【推荐系统】融合 MF 和 RNN 的电影推荐系统
产业智能官
23+阅读 · 2018年1月4日
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员