点击关注我们,提升学习效率
title:Learning Multi-granularity Consecutive User Intent Unit for Session-based Recommendation
link:https://arxiv.org/pdf/2112.13197.pdf
from:WSDM 2022
1. 导读
本文针对会话推荐方向,相较于关注序列中的单个商品,本文关注如何利用GNN从连续片段中捕获用户偏好。通过多粒度连续用户意图单元捕获用户兴趣,作者提出了多粒度意图异构会话图(MIHSG),它捕获了不同粒度意图单元之间的交互并减轻了长依赖的负担。此外,作者提出了意图融合排名(IFR)模块来组合来自各种粒度用户意图的推荐结果。
2. 方法
令 表示所有的商品的集合,会话表示为 ,其中L是会话长度, 表示在位置 时商品的id。目的是给定s_i后,预测
现存的会话推荐的方法更多的关注会话中的那个商品,而忽略了会话所能反映的更高级别的用户意图。本节所提方法不仅学习单个商品所表达的意图,还学习了连续片段中商品的组合意图。令 表示一个连续片段,从第j个开始,长度为k。k表示连续意图捕获的粒度大小。对于给定的会话s,用 表示粒度为1的embedding,也就是单个商品的embedding,对于粒度级别为k的片段,用函数R来对片段内的商品embedding进行聚合,公式如下,
这部分考虑两类函数R,产生两类表征,即基于集合和基于序列来生成高级意图单元的表示。一方面,基于集合的聚合函数,例如MEAN、MAX 等可以提取顺序不变的意图;另一方面,基于序列的函数,例如Gate Recurrent Unit (GRU) 可以提取顺序敏感的意图。然后将两类表征相加,公式如下,
MIHSG 由多个子图组成,每个子图对同一级别连续意图单元的意图之间的转换进行建模。由 level-𝑘 连续意图单元构建的图被定义为 level-𝑘 意图会话图。
level-k表示粒度为k的情况。level-k会话图捕获了用户-商品交互的空间连续性。他是有向图 ,每个节点代表一个level-𝑘连续意图单元的意图,每条边连接两个连续相邻level-𝑘连续意图单元。如果节点在会话序列中相邻,则它们具有连接。level-1会话图捕获商品之间的细粒度意图转换。随着意图单元长度的增加,会话图包含意图单元之间的更高级别的转换模式。
将上述构建的不同粒度的会话图整合后,构建统一的异构会话图,MIHSG。这里引入一种边,命名为粒度间的边(inter-granularity edge),用这种边链接不同粒度的会话图和粒度为1的连续会话图。例子:在会话 𝑠 = {𝑣1, 𝑣2, 𝑣1, 𝑣3} 中,可以构造两个粒度间的边。它们是 (𝑣1, inter, (𝑣2, 𝑣1)) 和 ( (𝑣2, 𝑣1), inter, 𝑣3)。这可以捕获跨粒度级别的意图转换模式。上述例子中的(v2,v1)就是通过2.2节学习到的表征。
使用HGAT对有向图的节点表征进行学习。对于有向边(s, e, t),s是源节点,t是目标节点,e是边,粒度为k的节点可以表示为 , ,令 表示边的类型。对于一个粒度为k的MIHSG, ,。对于每一层,利用双向注意力机制,聚合出近邻和入近邻的表征。以入近邻为例,令 表示节点入近邻的节点集合。聚合公式如下,其中w和a是可学习参数,在不同层不共享。 , 是意图到单元的初始表征,σ为leakyrelu函数。
上述过程采用多头注意力机制,并采用取最大值而不是均值或拼接,公式如下,h是每个头,R是取最大。
利用HGAT对入近邻和出近邻分别进行聚合后,可以得到两类embedding 和 ,节点v的局部表征表示为上面两者的和,其最终表征为局部表征和会话中所有表征的均值的和
会话表征的计算不是在图上计算,而是在划分的k粒度的片段上计算。令每个片段的表征为 , , ,nk表示每个级别粒度的片段的数量,K表示所有可能的粒度级别。对于每个级别的连续意图单元,生成局部表征 和全局表征 来反映用户偏好。用该级别中最后一个单元 (即,最后的片段)作为 ,结合软注意力机制计算得到 。为了使每个级别的会话表征捕获完整的用户意图,文中组合所有意图单元的embedding以生成上下文集合, 表示其中过的元素。全局表征计算公式如下,主要就是通过注意力机制加权,这里不赘述。
粒度为k的用户偏好表征计算公式为,
根据上面的计算得到不同粒度的偏好表征后, ,利用意图融合排序来捕获更全面的用户偏好。首先在分别对不同级别粒度单独计算,对于每个粒度为k的意图,采用内积计算候选商品意图和粒度为k的会话表征之间的是相似度,公式如下,
考虑复购和探索问题,文中将会话中的商品和会话外的商品区分开,分别对计算得到的y采用softmax,公式如下,
其中R是会话内的商品的集合,O是会话外的商品的集合,|I|=|O|+|R|。因为在会话内的,可能会有重复点击,将会话内外的区分开,能一定程度上考虑到复购和探索问题。通过加权来平衡重复点击和探索点击,公式如下,
意图融合排名(IFR)融合所有粒度级别的意图预测的推荐结果。引入一个加权求和算子来融合各级意图生成的概率分布,以生成最终的概率分布 y,公式如下,其中α是可学习参数,相当于对α进行标准化后加权。
最后损失函数采用交叉熵损失函数。
3. 实验结果