本教程的目标是向RecSys社区介绍基于知识图谱的可解释推荐系统的开发和评估的最新进展。本文将首先介绍概念基础,通过调查最新进展并描述知识图谱如何被集成到推荐管道中的现实例子,也是为了提供解释。本教程将继续系统地介绍使用知识图谱对推荐系统进行建模、集成、训练和评估的算法解决方案,特别注意可解释性的角度。实践部分将为与会者提供基于知识图谱的推荐系统的具体实现,利用开源工具和公共数据集;在这一部分,教程参与者将参与设计与建议配套的解释,并阐明其影响。我们通过分析新出现的开放问题和未来的方向来结束本教程。
**介绍可解释的推荐(20分钟)**我们将首先提供可解释推荐研究的历史概述。事实上,尽管“可解释推荐”这个术语是近年来才正式引入的,但其基本概念可以追溯到个性化推荐研究中最早的一些作品。我们将给出现实世界中解释可以影响推荐的例子,考虑到音乐、教育和社交平台等领域。解释是向用户显示的一条信息,解释为什么推荐某个特定的项目。在这一部分中,我们将重点关注推荐解释的不同信息源(或显示风格)。然后,我们对现有的可解释推荐方法进行了分类,这可以帮助与会者了解可解释推荐研究的最新进展。我们将提出受解释影响的目标(效用、覆盖面、多样性、新颖性、可见性、曝光率),并提供相关工作。解释还会对经济、法律、社会、信任、技术和心理学等多个视角产生影响。
**基于知识图谱的可解释推荐模型(20分钟)**我们将提供推荐管道的初步概述,以描述应如何在几个阶段实现解释,即数据采集和存储、数据准备、模型训练、模型预测、模型评估和推荐交付。在本部分中,我们将深入研究现有的方法,这些方法使用KG来增强传统模型,并在优化函数中嵌入正则化项,以隐式地编码来自KG的用户和产品之间的高阶关系。然后,根据KG结构,详细介绍了依赖预计算路径(元组)建模用户和产品之间高阶关系的方法。最后,根据所考虑的方法,我们展示了如何从具有知识图谱的推荐系统中产生不同类型的解释。
**可解释的推荐评估(20分钟)**首先,我们将介绍最先进的评估策略,利用基于志愿者或付费实验对象的用户研究。虽然这是最有效的策略,但也是最耗时和昂贵的。然后我们将转向另一种类型的评估,即在线评估,通过在线实验来评估可解释的推荐,调查不同的角度,如说服力、有效性、效率和解释的满意度。随后,我们提出了离线评估推荐解释的主要方法,如评估可由解释模型解释的推荐的百分比和直接评估解释质量。在这一部分中,我们还将指出我们最近在定义解释质量的离线评价指标方面所做的工作。我们将介绍现实世界平台的例子,如LinkedIn和Spotify,以及根据所述建模策略处理解释的方法。
**实践中的推荐模型(35分钟) **为了实际展示本教程第一部分中介绍的方法,我们首先介绍三个数据集,分别代表电影(MovieLens-1M (ML1M))、音乐(LASTFM - 1b (LASTFM))和电子商务(亚马逊手机)领域。它们是公共的,在领域、广泛性和稀疏性方面各不相同。 然后,我们加载并呈现了文献中为三个考虑的数据集提供的KG,并展示了应该如何对这些信息进行预处理,以便在优化和推荐生成过程中启用推荐模型,利用它们的内容。 在接下来的步骤中,我们创建并训练了至少两种最新的基于路径的方法,它们支持文本解释,例如PGPR和CAFE,它们依赖于RL代理,通过在KG中用户和被推荐产品之间导航路径来优化推荐。 展示了如何从预训练的可解释推荐系统开始创建top-n推荐,并测量传统的有效性指标,如NDCG。
**解释的创造和影响(30分钟) **在第二部分中,我们首先展示了如何创建文本解释,从预训练的可解释推荐系统开始,以伴随用户提供的top-n推荐。 然后,我们计算最先进的离线评价指标,以评估解释的质量,如链接交互的近代性,共享实体的受欢迎程度,和解释类型的多样性。 最后,我们检查和比较第一部分训练的(至少两个)模型提供的解释,并分析解释的影响和引起的权衡。