基于会话的推荐方法综述

近年来,基于会话的推荐方法受到学术界的广泛关注。随着深度学习技术的不断发展,不同的模型结构被应用于基于会话的推荐方法中,如循环神经网络、注意力机制、图神经网络等。该文对这些基于会话的推荐模型进行了详细的分析、分类和对比,阐明了这些方法各自解决的问题与存在的不足。具体而言,该文首先通过调研,将基于会话的推荐方法与传统推荐方法进行比较,阐明基于会话的推荐方法的主要优缺点;其次,详细描述了现有的基于会话的推荐模型如何建模会话集中的复杂数据信息,以及这些模型方法可解决的技术问题;最后,该文讨论并指出了在基于会话推荐的领域中存在的挑战和未来研究的方向。

随着大数据时代的到来,互联网的规模日益庞大,这为用户带来极其丰富且复杂的信息,使得用户能方便、快捷地获取信息。然而,面对海量的信息, 用户往往不能迅速地获取自己需要的内容,导致对信息的使用效率有所下降,也就是所谓的信息超载 (InformationOverload)[1]。解决信息超载问题,目前有两个常用的方法,一是搜索引擎,二是推荐系统。推荐系统根据用户的个人信息或历史行为来学习用户的兴趣偏好,并为用户生成其感兴趣的推荐序列。目前,推荐系统应用于许多领域[2],例如,电子商务[3]、新闻推荐[4-5]、音乐推荐[6]以及位置服务[7]等。传统推荐方法主要包括两种:一是基于内容的推荐方法,二是基于协同过滤的推荐方法。基于内容的推荐方法[8]是根据用户(User)的兴趣简介与项目(Item)的特征描述实现推荐。其中,用户的兴趣简介也就是用户的兴趣偏好,它可以来源于用户主动输入,但往往是从用户与过去项目交互中获得的;项目的特征描述可以是项目的描述或用户对该项目的评论。基于内容的推荐方法在一定程度上可以解决冷启动(Cold-Start)问题[9]。同时,基于内容的推荐方法具有很好的可解释性,但基于内容的推荐方法在项目的特征提取上存在一定难度,且难以挖掘出用户的潜在兴趣偏好。

基于协同过滤的推荐方法是基于用户或项目间的相关性进行推荐的方法,主要可以分为两类,即基于用户的协同过滤以及基于项目的协同过滤。基于用户的协同过滤,也可称为 K-NN(K-NearestNeighbor) 协同过滤,其核心思想是根据用户的历史行为找到与当前用户行为偏好相似的用户,然后为该用户推荐这些相似用户感兴趣的项目。基于项目的协同过滤的方法关注的不是用户之间的相似性,而是项目之间的关联性,也就是说,若两个项目被相同的用户喜欢或不喜欢,那么这两个项目是相关的,系统为用户推荐相关的项目[10]。基于协同过滤的推荐方法能够挖掘出用户的潜在兴趣,帮助用户发现新的兴趣,提高推荐的质量,但是其难以解决冷启动问题; 同时,基于协同过滤的推荐方法受到数据稀疏性的影响,随着数据量的增大,数据的稀疏性也随之增大 (如一个用户只与所有项目中的几个有交互),这就使得计算最邻近(最相似)用户或项目的准确率降低,影响最终推荐结果。

以上传统的推荐方法各有优缺点,随着互联网规模的增大,数据量也越来越大,传统推荐方法的不足也越来越明显。除了它们各自的缺点外,传统推荐方法存在的共同点是:只能够考虑用户长期静态偏好,而忽略了用户兴趣随时间的变化。因而出现了序列推荐 (SequentialRecommendation)[11]。这一类专注于行为序列性的推荐模型,通过对用户历史行为的序列化建模,学习用户的兴趣,进而对用户进行相关推荐。随着序列推荐的深入研究,其弊端也开始出现, 即:偏向于长期兴趣的学习,而忽略了用户短期内偏好的转移,使得用户在某一段时间内的兴趣变化被其历史交互行为所掩盖,从而生成不可靠的推荐结果。产生这个问题的原因是忽略了用户行为的事务性结构,例如用户之前长期购买牛仔裤,某一时段突然喜欢运动裤,但由于用户购买的牛仔裤历史记录远远多于运动裤,使推荐系统认为用户的偏好仍为牛仔裤。在此背景下,将用户行为分解成更小的粒度,考虑用户行为的事务性结构,捕捉用户短期偏好的转移是十分有必要的,因此基于会话的推荐系统(Session-BasedRecommendationSystem,SBRS) 得到了快速的研究和发展.

基于会话的推荐方法是将用户的全局交互行为分割成一个个更小粒度的事务单元,每个事务单元是由用户的部分交互行为组成的,这些事务单元被称为会话[12-13]。会话可以在不同的场景中表现出不同的含义,例如,在电子商务领域,会话可以是用户一次购买的物品,或一小时内添加到购物车的商品;在旅游场景,会话可以是用户一年内游玩的景点;另外,会话也可以是用户一小时内浏览的网页、一天内看的电影等。基于会话的推荐算法通过学习这些会话内以及会话间项目的依赖关系,挖掘出用户的兴趣偏好,并为用户生成其感兴趣的推荐列表。如图1所示,用户的购物行为构成用户与项目的交互序列,其中,U 表示用户、V 表示项目、S 表示会话。在传统的推荐方法中往往通过全局的项目序列来挖掘用户兴趣,而在基于会话的推荐系统中,用户的购物行为会根据购物的次序将用户行为分割成粒度更小的会话,以这种方法保留用户行为的事务结构,获取用户行为中更多的转换信息和依赖关系;基于会话的推荐方法不仅仅关注用户最新的交互行为①,同时包括当前会话中其他项目②以及历史会话对当前推荐结果的影响,这种只需要根据会话中物品依赖关系进行推荐的特性,使其能够为匿名用户进行推荐。总的来说,基于会话的推荐方法以会话作为基本单元,不仅能够捕捉更多的项目间的转换信息和依赖关系,还能聚焦于当前会话,适时捕捉到用户兴趣的变化,从而改善推荐的效果。

基于会话推荐方法解决了传统推荐系统只关注用户长期静态偏好、无法及时发现用户兴趣变化的问题。但是,基于会话的推荐方法仍存在一些问题,例如,基于会话的推荐方法难以捕捉用户长期静态偏好。表1在输入、核心思想、优点与缺点等方面,将传统的推荐方法与基于会话的推荐方法进行了对比,能直观地表现出各类推荐方法的优势与不足。

针对基于会话推荐方法存在的问题,许多学者开展了深入的研究。近年来,深度学习的发展为基于会话的推荐方法带来了机遇。随着深度学习在自然语言处理、语音识别、图像识别等多个领域的突破性进展,循环神经网络(RecurrentNeuralNetwork, RNN)、图神经网络 (Graph Neural Networks, GNN)等深度学习模型被应用于基于会话的推荐算法中。目前,随着新技术的不断发展,国内外的基于会话的推荐领域的综述性文章[12]较少,且这些文章并未对目前已提出的方法和已解决的问题进行详细的对比、分析和总结。因此,一篇详细归纳和总结在基于会话的推荐领域已取得的进展的综述文献十分必要。本文对基于会话的推荐方法进行了详细、全面的调研,对已有的研究成果进行梳理,以期对从事推荐算法和系统的理论研究及实践开发人员提供参考和启发。

2. 基于会话推荐方法的分类

近年来,基于会话的推荐方法发展迅速,众多学者提出了大量的模型和方法,本节从技术角度对基于会话的推荐方法进行分类。首先介绍如协同过滤、矩阵分解、马尔科夫链等的传统会话推荐方法; 进而介绍基于深度学习的会话推荐方法,包括循环神经网络、注意力机制、图神经网络等,最后介绍基于强化学习的会话推荐方法.

2.1 传统的会话推荐方法

2.1.1 基于协同过滤的会话推荐方法协同过滤[14]是传统的推荐系统中常用的方法, 其主要包括两种算法:基于用户的最邻近算法[15] 和基于项目的最邻近算法[16]。

2.1.2 基于矩阵分解的会话推荐方法推荐方法往往是通过分析用户的历史交互数据来挖掘用户偏好,通常这些数据包含两种类型:用户和项目。这些数据可以构成一个矩阵,一维代表用户,另一维代表用户感兴趣的项目。但由于大多数用户只与少量项目交互,因此该矩阵是比较稀疏的,单纯依赖这种稀疏矩阵去产生推荐的正确率是十分低下的。矩阵分解通过补充隐式反馈信息构造一个相对稠密的矩阵,然后将用户和项目映射到同一潜在向量空间中,使得每一个用户u 都对应一个潜在的向量qu,每一个项目v 都对应一个潜在向量 pv,此时,用户 u 对项目v 的评分ru,v 可表示为式(4),即用户的潜在向量qu 表示与项目的潜在向量表示pv 的点乘。

2.1.3 基于马尔科夫链的会话推荐方法协同过滤为了寻找用户或项目的邻居,往往过于依赖用户与系统的历史交互数据,尤其是用户对项目的评级(评分)信息,但是忽略了用户与项目交互的顺序性。例如,用户在浏览商品时,用户的点击浏览操作是有次序的(一个商品到另一个商品),协同过滤无法对这种顺序行为进行建模,从而无法挖掘出用户行为的序列模式。

2.2 基于深度学习的会话推荐方法

随着算力的不断提升和深度学习的不断发展, 越来越多的科研人员将深度学习应用到基于会话的推荐方法中,并取得了一系列的成果。基于深度学习的会话推荐方法不仅能够分析数据间的显式联系,还能够学习到用户、项目等数据的隐式特征,生成表达能力强大的嵌入表示,进行更可靠的推荐。不同的深度学习模型被应用于基于会话的推荐系统中来解决不同的问题。例如,会话集常按照时间戳或用户实际的交互顺序来进行分割,会话集中的会话往往具有序列关系,同时,会话中的项目也具有顺序关系,因此对序列关系敏感的循环神经网络被应用于基于会话的推荐方法中。传统的推荐方法往往只能够考虑到用户的长期偏好,而基于会话的推荐方法将用户行为分割成更小粒度的会话集,通常只能聚焦于用户的短期偏好。为了使基于会话的推荐方法既能考虑用户的长期偏好也能够关注用户的短期偏好,注意力机制被应用其中;图神经网络能够建模会话集中复杂的项目转移关系,从而学习出表达能力极强的项目嵌入表示,在基于会话的推荐方法中广泛应用。后文将根据模型类别对已有的推荐方法进行分类总结,并对各类方法进行详细对比。

2.3 基于强化学习的会话推荐方法

会话推荐通常以自监督进行训练,给定会话序列,计算下一项推荐。这种训练模式可能会根据项目相关性找出最优的结果,但是对于用户来说有可能还有其他需求。近年来,推荐结果多样性和新颖性的重要程度逐渐提高,因为推荐多样化的项目更有可能符合用户的实际需求。为了针对上述多个目标优化推荐系统,通常需要用可微函数进行优化,然而在目标只能以不可微的形式呈现的领域难以使用多目标优化 (MultiObjectiveOptimization,MOO)。为了解决这一问题,Stamenkovic等人[61]使用强化学习(ReinforcementLearning,RL)的策略,引入了标量化多目标强化学习 (Scalarized Multi-Objective Reinforcement Learning,SMORL)方法。SMORL 使用单个强化学习智能体(Agent)同时满足三个可能相互冲突的目标:提高点击率,使推荐多样化,以及引入新项目。该模型专注于选择的奖励,同时保持高相关性排名性能。

3 数据优化及数据集

基于会话的推荐方法与传统推荐方法或序列推荐方法[11]的不同点也体现在数据结构上,基于会话的推荐方法是以会话作为数据的基本单元。会话是用户行为被分解后形成的一个个有序项目组,在会话间不仅能够找到项目序的关系,也能够聚焦于用户行为的事务特性①。在深度学习被应用于基于会话的推荐领域初期,由于训练数据存在一些问题,导致最终的推荐效果并不是十分理想。因此,许多学者在数据预处理、排名损失函数[62]等方面进行了优化。其中较为典型的是 Tan等人[63]提出的优化策略。

4 基于会话的推荐方法未来研究方向

近年来,基于会话的推荐方法快速发展,众多学者针对已存在的问题提出了不同的模型方法,如上文提到的利用循环神经网络挖掘会话中项目的序列模式、利用图神经网络建模项目间复杂的转换关系等。但目前对于基于会话的推荐方法的研究仍处于初级阶段,仍存在一些挑战,这些挑战是未来值得研究的方向。本节将针对基于会话的推荐方法可能面临的挑战进行阐述。(1)基于会话的推荐中的长期偏好;(2)用户多行为联合推荐; (3)下一个会话的推荐; (4)跨域会话推荐

5 结论

本文对基于会话的推荐方法进行了详细地调研。首先分析了传统推荐方法的优劣势,针对其只能学习用户长期偏好的问题,阐明了基于会话的推荐方法捕捉用户短期偏好的重要意义,并详细介绍了基于会话推荐方法的工作原理和目标。其次,本文对当前已有的基于会话的推荐算法进行了分类总结,对比了基于不同模型下的推荐方法的优劣势,并详细介绍了这些模型方法的工作原理,如基于循环神经网络的会话推荐方法建模会话中项目的序列模式,基于注意力机制的会话推荐方法捕捉用户当前的主要意图,以及基于图神经网络的会话推荐方法建模会话上下文项目的转换等。最后,针对基于会话的推荐方法可能面临的挑战和有潜力的研究方向进行了说明。

成为VIP会员查看完整内容