论文浅尝 | KR-GCN: 知识感知推理的可解释推荐系统

2022 年 6 月 29 日 开放知识图谱

论文作者：马婷，中国科学院信息工程研究所直博生

动机

抽取并利用知识图谱(KG)中的多跳关系路径可以提高推荐系统的性能，并提供可解释性。然而，现有的工作仍面临着两个主要的挑战：用户偏好的错误传播和模型的弱解释性。提取并利用用户物品对之间的所有路径会引入不相关的路径，从而导致用户偏好的错误传播。尽管定义元路径在一定程度上可以缓解错误传播问题并提供一定的解释性，但模型的性能将严重依赖于预定义的元路径；最近一些基于GCN的模型在推荐任务上取得了较好的性能，但未能提供可解释性。为了解决上述问题，本文提出了KR-GCN，能够在提高推荐系统性能的同时，提供非预定义的DAG图形式的解释能力。

亮点

KR-GCN的亮点主要包括：

1.为了缓解错误传播问题，文章利用知识图谱表示方法计算三元组的打分，并采用核采样自适应地选择用户物品对之间的路径，以有效去除冗余信息。2.为了提升推荐的性能并保证解释的多样性，文章将用户物品交互数据和知识图谱结合构成一个异构图，利用图卷积网络学习异构图的表示，然后采用路径级的注意力机制来区分不同路径的贡献并预测最终的交互概率，提升最终解释的相关性。3.在三个数据集上进行实验，与基线模型相比，本文所提出的模型在性能上取得了一定的提升，同时，人工评估验证了KR-GCN 可信赖的解释能力。

模型

KR-GCN包括四个模块：图编码模块、路径抽取与选择模块、路径编码模块和偏好预测模块。图编码模块旨在学习异构图中的节点表示，路径抽取与选择模块旨在从异构图中抽取出用户和物品之间的路径并从中选择出高质量的推理路径，路径编码模块用于学习推理路径的表示，偏好预测模块则根据推理路径来预测用户的偏好。

模型整体框架如下：

•图编码

为了学习用户、物品和知识图谱中实体的表示，KR-GCN利用图表示模型GCN对包含用户物品交互数据和知识图谱的异构图进行编码。

其中 $e_i^{(l+1)}$ 和 $e_i^{(l)}$ 是节点i在第 l层和l+1层的节点表示， $e_j^{(l)}$ 是i的第j个邻居节点在第 l层的表示， $e_i$ 为节点i的最终表示， $α_l$ 表示第l层的权重，即第l层对最终目标节点表示的重要性。

•路径抽取与选择

本文在异构图上抽取用户物品对之间的多跳路径，用于获取用户的潜在兴趣的表示。然而考虑用户物品对之间的所有路径会涉及不相关的路径，导致错误传播问题。虽然定义元路径可以缓解错误传播的问题，但设计正确的元路径需要对特定领域的知识有深入的了解。为了解决错误传播和知识依赖问题，本文对用户物品对之间的不相关路径进行了修剪。对于用户物品对 (u, v)，本文找到u和v之间的路径集合 $S_{uv}$ 。由于用户物品对之间的路径数量随着路径跳数呈指数增长，因此本文在提取路径时对跳数进行限制。

考虑到在知识图谱中迭代每个用户物品对之间的所有路径效率低下，本文采用启发式的路径搜索算法进行路径抽取和选择。具体地，我们设计了一种基于特征转换的方法来为三元组打分，并利用核采样在用户物品对之间的路径中自适应地选择三元组，我们使用 $∆_{k-1}$ 和 $∆_k$ 表示路径搜索中的第k-1跳和第k跳中的节点集合。对于节点集合 $∆_{k-1}$ 中的节点 $i_{k-1}$ ，我们在图中搜索它的邻居作为节点 $i_{k-1}$ 的下一跳节点，对于邻居节点，通过知识图谱表示方法计算对应三元组 $(i_{k-1},r_{k-1},i_k)∈T_{k-1,k}$ 的分数，其中 $T_{k-1,k}$ 是第k-1和k跳之间的三元组。在本文中，三元组的分数通过TransH计算得出。

在计算了三元组 $(i_{k-1},r_{k-1},i_k)$ 的得分后，我们采用核采样在每个用户物品对之间的路径中自适应地选择三元组，TransH和核采样被用于进行路径排序和选择，滤低质量路径，进而解决路径上的错误传播问题。核采样旨在自适应地对候选概率分布的 top-p部分进行采样，我们的目标是降低低质量路径的分数并对其进行过滤。三元组内的语义关联（即置信度）越高，三元组的得分越高，那么路径被选中的概率越大，也就是说，得分较高的三元组对路径选择的贡献更大。

在每一跳，三元组从累积概率超过阈值的最小可能的三元组中选择，其中累积概率是通过对三元组的概率分数求和来计算的，采样的三元组的数量可以根据概率分布动态增加或减少，为了进行核采样，三元组分数被归一化用来计算三元组的概率。

其中 $f(e_i^{k-1},e_r^{k-1},e_i^k)$ 是 $(i_{k-1},r_{k-1},i_k)$ 的分数，由TransH计算得出。给定第 k-1跳和第 k跳之间三元组的概率分布，被选择的三元组 $topp(T_{k-1,k})⊂T_{k-1,k}$ 被定义为满足以下条件的最小集合：

其中p是概率阈值。然后选择 $topp(T_{k-1,k})$ 中的三元组作为推理路径中的推理三元组，在每一跳，以与上述相同的方式选择三元组，最后形成推理路径集合 $S_{uv}$ 来反映用户u的潜在兴趣，减轻错误传播的影响。

•路径编码

虽然 $S_{uv}$ 已经包含了u和v之间的路径信息，但是这些路径主要是针对物品v的，不能反映用户u的其他兴趣，为了挖掘用户的更多兴趣，我们将用户的历史交互与选择路径的进行结合来捕获选择的路径和用户历史交互之间的相互影响。

KR-GCN 利用LSTM和注意力机制对选择的推理路径进行编码，该模块将图编码模块和路径抽取与选择模块的输出作为输入，图编码模块提供节点表示，路径提取和选择模块提供路径信息。由于路径中不同节点之间存在多跳关系信息和顺序依赖关系，因此该模块旨在捕获多跳关系信息并对每条路径内的顺序依赖关系进行编码。对于路径序列 $S_{uv} [j]$ ：

其中 $P_{uv} [j]$ 是用户 u和物品v之间选择的路径 $S_{uv} [j]$ 的表示， $α_{h_t }$ 表示节点 $i_t$ 对路径 $S_{uv} [j]$ 的重要性，用户 u和物品v之间的多跳推理路径（或潜在关系） $S_{uv}$ 由一组向量 $P_{uv}$ 表示，这些路径表示可以反映u的潜在兴趣传播。

•偏好预测

在推荐中，不同的路径通常对预测用户偏好的贡献不同，为了区分每个用户物品对之间不同路径对推理的不同贡献， KR-GCN采用了路径级的自注意力机制，学习每条路径上的路径权重，然后具有不同权重的多跳路径被聚合以表示用户的偏好。

其中 $p_{uv}$ 是路径集合 $S_{uv}$ 通过self-attention机制和max-pool操作的表示，最终的预测得分 $y ̂_{uv}$ 为用户u与物品v的交互概率，即用户偏好预测得分。

实验

本文在Amazon-book，Yelp2018和Last-FM三个数据集上进行实验，KR-GCN 在三个数据集上的性能都优于基线模型，性能比较结果验证了 KR-GCN 的有效性。

与基线模型中的最佳性能结果（即Amazon-book中的JNSKR、Yelp2018和Last-FM 中的 KGAT）相比，KR-GCN的Recall@20分别提高了 4.9%，8.5% 和 2.5%，NDCG@20分别提高了4.4%，5.0% 和 2.1%。我们将所提KR-GCN 优越的推荐性能归因于利用图结构信息和语义信息，并选择了更有助于预测用户偏好的推理路径。

我们从Amazon-book中选择了一个示例来展示KR-GCN的可解释性，可以发现，与对比模型相比，KR-GCN 在用户和物品之间提供了更多类型的关系。

总结

本文提出了KR-GCN用于可解释性推荐，文章将用户物品交互数据和知识图谱集成到异构图中，并使用图卷积网络对异构图进行编码，为了解决图中的错误传播问题，文章设计了一种基于特征转换的方法对用户物品对之间的多跳路径内的三元组进行打分，并利用核采样自适应地选择三元组。为了提供可解释性，文章引入了路径级的自注意力机制来区分不同选择路径的贡献并预测交互概率，同时提供权重最高的路径作为推荐的解释。

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。