最新综述 | 基于因果推断的推荐系统

2022 年 9 月 1 日 机器学习与推荐算法

嘿，记得给“机器学习与推荐算法”添加星标

目前，推荐系统在信息过滤中起着至关重要的作用。现有主流的推荐系统主要是通过学习数据中的相关性进而提取用户的行为偏好，例如协同过滤中的行为相关性，点击率预测中的特征-特征或特征-行为相关性。然而，遗憾的是，现实世界是由因果关系而不是相关关系驱动的，相关关系并不意味着因果关系。例如，推荐系统可以在用户购买手机后向其推荐电池充电器，其中后者可以作为前者的原因，而这种因果关系是无法反过来的。最近，为了解决这个问题呢，推荐系统的研究人员开始利用因果推理来提取因果关系，进而增强推荐系统的性能。

在本文综述中，全面回顾了近年来基于因果推理的推荐算法的研究。具体的，首先介绍了推荐算法和因果推理的基本概念。然后提出了非因果性推荐算法所面临的问题。之后，根据因果推理所解决的问题进行分类，全面回顾了基于因果推理的推荐算法的现有工作（即针对数据偏差的因果推理推荐算法、针对数据缺失和噪声的因果推理推荐算法以及基于因果推理的其他非准确性的推荐算法）。最后，本文讨论了这个领域的开放性问题以及未来工作。

https://arxiv.org/abs/2208.12397

本文将主流的基于相关性建模的推荐算法分为了协同过滤算法和基于内容的推荐算法（也称为点击率预估算法）。协同过滤算法主要用来建模交互行为，比如点击、购买等操作。经典的算法包括MF、NCF、基于图的推荐算法、一些序列化推荐算法、社交推荐算法等；点击率预估算法主要用来利用丰富的属性信息、上下文信息以及用户和物品的特征信息来增强推荐系统。主流的方法包括FM、DeepFM、AFM等。

然而，现实世界是由因果关系而非相关关系驱动的。在推荐系统中广泛存在两种因果关系，用户层面和交互层面。用户层面的因果关系指的是用户的决策过程被因果关系所驱动。例如，用户在购买手机后可能会购买电池充电器，在这种情况下，后者可以作为前者的原因，而且这种因果关系不能被逆转。交互层面的因果关系是指推荐策略在很大程度上影响了用户与系统的互动。例如，未观察到的用户与物品的交互并不意味着用户不喜欢该物品，这可能只是因为简单的没看到所造成的。

从形式上来讲，因果关系可以定义为原因和结果，其中原因对结果有部分责任。因果推理被定义为根据实验数据或观察数据确定并进一步利用因果关系的过程。两个流行和广泛使用的因果推断框架是潜在的结果框架（Rubin因果模型），以及结构性因果模型（SCM）。Rubin因果模型的目的是计算某些对策的效果。结构性因果模型构建了一个因果图和相应的结构方程，其中有一组变量和结构方程描述了变量之间的因果关系。

由于遵循相关性驱动的范式，现有的推荐系统仍然受到关键瓶颈的困扰。具体来说，三个主要的挑战限制了当前范式的有效性（即数据偏差、数据缺失与噪声以及超越精度的推荐目的难以实现），因果推理可以作为一个有希望的解决方案。

首先，具有因果关系的推荐方法可以构建因果图，在这种情况下，偏差可以被视为大多数情况下的混杂因素（Confounder），这一点可以通过因果推理技术进一步解决。第二，对于数据缺失，因果关系增强的模型可以帮助构建一个反事实（Counterfactual）的世界，从而可以通过反事实推理来收集缺失的数据。第三，因果推理自然可以帮助建立可解释和可控制的模型，在此基础上可以实现模型本身和推荐结果的可解释性。此外，由于模型变得可控，其他超越精度的目标，包括多样性、公平性等也可以实现。具体来说，目前推荐中的因果推理工作可以分为以下三类，即针对数据偏差的因果推理推荐算法、针对数据缺失和噪声的因果推理推荐算法以及超越推荐精度的因果推理推荐算法。

基于因果推理的数据去偏

对于流行偏差（popularity bias）或曝光偏差（exposure bias），偏差可以看作是一种在大多数情况下的一种混淆因素。一些现有的工作通过后门调整来解决这个问题。对于符合性偏倚（conformity bias），它可以被描述为一种碰撞器效应。近期该类别的相关工作总结如下。

基于因果推理的数据增强和数据去噪

数据缺失问题包括有限的用户数据收集和推荐模型对系统的因果影响。第一折的极端情况甚至会产生数据噪声问题。对于第一种情况，反事实推理可以帮助生成未收集的数据作为已有数据的补充，从而解决数据缺失问题。对于第二种情况，因果模型（如IPW）可以估计推荐模型的因果效应。近期该类别的相关工作总结如下。

基于因果推理的超越精度的推荐系统建模

超越精度（Beyond-accuracy）在这里指除了考虑推荐精度之外的以人为本的目标，具体可以是多样性、可解释性、可控性以及公平性等指标。按照因果图设计的模型自然是可控的，其中一些代表性的技术包括因果发现、解耦表示等。高多样性可以通过控制模型来避免权衡，而公平的推荐可以通过控制模型来实现对特定用户人群的公平推荐。近期该类别的相关工作总结如下。