因果如何用于推荐？清华等最新《推荐系统中的因果推理》综述论文，29页pdf阐述因果推荐方法体系

2022 年 8 月 31 日 专知

现有的推荐系统方法更多的是对相关性建模，但难于保证推荐系统的鲁棒性等。来自清华中科院等最新《推荐系统中的因果推理》综述论文，全面回顾了基于因果推理的推荐的文献，非常值得关注!

推荐系统在当今的信息过滤中起着至关重要的作用。现有的推荐系统是通过学习数据中的相关性来提取用户偏好的，如协同过滤中的行为相关性，特征-特征，或者预测点击率中的特征-行为相关性。然而，令人遗憾的是，现实世界是由因果关系而不是相关性驱动的，而相关性并不意味着因果关系。例如，推荐系统可以在用户购买手机后向其推荐电池充电器，后者可以成为前者的原因，而这种因果关系是无法逆转的。近年来，为了解决这一问题，推荐系统的研究人员开始利用因果推理来提取因果关系，增强推荐系统。在这项综述中，我们全面回顾了基于因果推理的推荐的文献。首先，我们提出了推荐和因果推理的基本概念，作为后面内容的基础。我们提出了非因果性推荐所面临的典型问题。然后，我们全面回顾了基于因果推理的推荐的现有工作，基于因果推理解决的问题的分类。最后，我们讨论了这一重要研究领域有待解决的问题，以及未来值得关注的工作。

https://www.zhuanzhi.ai/paper/c0a2efd0fa2bb09875e3eb5c8e570cb8

在信息过载的时代，推荐系统(RecSys)已经成为方便用户获取信息的基础服务。从早期的浅层模型[40,63]，到最近的基于深度学习的模型[13,27]，再到最近的基于图神经网络的模型[25,114]，推荐系统的技术和模型发展迅速。一般来说，推荐系统的目标是通过匹配用户的历史行为，以及收集到的用户配置文件、商品属性或其他上下文信息来了解用户的偏好。这里的交互主要是由之前的推荐系统诱发的，很大程度上受推荐策略的影响。然后，推荐系统从候选商品池中筛选，并选择符合用户个性化偏好和需求的商品。一旦部署，系统就会收集新的交互来更新模型，这样整个框架就形成了一个反馈循环。

一般来说，推荐系统可以分为两类，即协同过滤(CF)和基于内容的推荐(又称点击率预测，简称CTR预测)。协同过滤关注用户的历史行为，如点击、购买等。协同过滤的基本假设是，具有相似历史行为的用户，其未来行为也会趋于相似。例如，最具代表性的矩阵分解模型MF (matrix factorization model)使用向量来表示用户和商品，然后使用内积来计算用户和商品之间的相关性得分。为了提高模型的能力，最近的工作[13,27]利用深度神经网络来匹配用户和项目，如神经协同过滤[27]，它利用多层感知器来取代MF模型中的内积。此外，协作过滤的广泛视角考虑了附加信息，如顺序推荐中的每个行为的时间戳[10,115]、社交推荐中的用户社交网络[14,99]、多行为推荐中的多类型行为[18,101]等，对相关性进行了建模。点击率预测的重点是利用丰富的属性和特性的用户，项目，或上下文来增强推荐。主流的CTR预测任务旨在通过适当的特征交互模块学习高阶特征，如FM (Factorization Machine)中的线性内积、DeepFM[20]中的多层感知器、AFM中的注意力网络[103]、AutoInt中的叠置自注意力层[77]等。

当今推荐系统的基础是建立相关性模型，例如协同过滤中的行为相关性，特征-特征，或者点击率预测中的特征-行为相关性。然而，现实世界是由因果关系而不是相关性驱动的，而相关性并不意味着因果关系。推荐系统中广泛存在两种因果关系:用户层面和交互层面。用户方面的因果关系是指由因果关系驱动的用户决策过程。例如，用户在购买手机后可能会购买电池充电器，而后者可以成为前者的原因，这种因果关系是不可逆转的。交互方面的因果关系是指推荐策略在很大程度上影响用户与系统的交互。例如，未观察到的用户-物品交互并不意味着用户不喜欢该物品，这可能只由未暴露引起。

从形式上讲，因果关系可以定义为原因和结果，其中原因对结果负有部分责任[111]。因果推断被定义为基于实验数据或观察数据来确定并进一步利用因果关系的过程[111]。两种流行且被广泛使用的因果推理框架是潜在结果框架(Rubin因果模型)[64]和结构因果模型(SCM)[57,59]。Rubin的框架旨在计算某些治疗方法的效果。结构因果模型构建一个因果图和相应的结构方程，其中有一组变量和描述变量之间因果关系的结构方程。由于采用了关联驱动范式，现有的推荐系统仍然存在严重的瓶颈。具体来说，三个主要挑战限制了当前范式的有效性，因果推理可以作为一个有前途的解决方案，如下所示。

数据偏差的问题。收集到的数据，例如最重要的用户-物品交互数据，是观察性的(而不是实验性的)，导致了偏差，包括从众性偏差、受欢迎性偏差等。[45]对于非因果性推荐系统，模型不仅学习了用户期望的偏好，而且还学习了数据偏差，导致推荐性能较差。
数据丢失甚至数据噪声的问题。推荐系统中采集的数据受限于采集过程，存在缺失或有噪声的数据。例如，尽管物品池规模很大，但用户只与一小部分物品进行交互，这意味着无法收集大量未被观察到的用户-物品反馈。此外，有时观察到的隐性反馈甚至是嘈杂的，并不能反映用户的实际满意度，例如那些在电子商务网站的点击行为，最后以差评结束，或者一些错误的行为。

超出精度的目标很难实现。除了准确性，推荐系统还应考虑其他目标，如公平性、可解释性、透明度等。提高这些超出精度的目标可能会损害推荐的准确性，导致两难。例如，一个考虑用户行为下的多重驱动原因的模型，基于对每个原因进行分解和可解释嵌入的分配，可以很好地提供准确和可解释的推荐。另一个例子是多样性。与高同质性的列表相比，高多样性的物品推荐列表可能无法符合用户的兴趣，因为对于高同质性列表，因果关系可以帮助捕捉用户为什么消费特定类别的物品，实现准确性和多样性。

最近关于推荐系统的研究通过精心设计的因果关系驱动方法解决了这些挑战。在过去的两年里，相关的论文层出不穷，因果推理很有可能会席卷推荐系统领域。在这篇调研论文中，我们系统地回顾了这些早期的研究成果，特别是关于它们如何解决因果推理的关键缺陷。首先，具有因果关系的推荐方法可以构建因果图，在大多数情况下，偏差可以被认为是混淆剂，这是进一步通过因果推理技术解决。其次，对于缺失的数据，因果增强模型可以帮助构建一个反事实的世界，从而可以通过反事实推理来收集缺失的数据。第三，因果推理可以自然地帮助建立可解释和可控的模型，在此基础上可以实现模型本身和推荐结果的可解释性。此外，由于模型变得可控，其他目标也可以实现，包括多样性、公平性等。具体而言，目前推荐中的因果推理工作可分为以下几类：

数据去偏与因果推理。对于受欢迎程度偏差或暴露程度偏差，这种偏差(由于受欢迎程度意识或暴露策略意识的数据收集)在大多数情况下可以被视为一种混杂因素。现有的一些工作通过后门调整来解决这个问题。对于整合偏差，它可以被描述为对撞机效应。

基于因果推理的数据增强和数据去噪。双重数据缺失问题包括有限的用户数据收集和推荐模型对系统的因果影响。第一次折叠的极端情况甚至会产生数据噪声问题。对于第一种情况，反事实推理可以帮助生成未收集的数据作为补充，这解决了数据缺失的问题。对于第二个方面，如IPW等因果模型可以估计推荐模型的因果效应。

基于因果推理的可解释可控推荐模型，实现可解释性、多样性和公平性。按照因果图设计的模型自然是可控的，其中具有代表性的技术包括因果发现、解缠表示等。基于可解释模型，通过控制模型可以获得较高的多样性，避免权衡，通过控制模型对特定用户群体的公平性来获得公平的推荐。

值得一提的是，尽管有关于推荐系统[21,98,117]或因果推断[22,51,51,112]的调研，但目前还没有关于因果驱动推荐系统这一新的重要领域的调研。这些推荐系统的综述主要介绍和讨论了推荐系统的基本概念和各种进展，并对基于因果关系的推荐进行了一些讨论。这篇因果推理综述主要介绍和讨论因果推理的基本概念和基本方法，对因果推理的应用探讨不够。我们总结这项调研的贡献如下。

据我们所知，我们采取开创性的步骤，对这个新的但有前途的领域进行系统的调研。我们通过回答为什么因果推理是必要的以及因果推理如何增强推荐的基本问题来分类现有的工作。
我们提供推荐系统和因果推理的必要知识，然后致力于介绍和解释因果推理的现有推荐工作，从早期的尝试和最近发表的论文到2022年。
我们讨论了该研究领域中重要但尚未解决的问题，并提出了有前景的方向，我们相信这将是未来几年的主流研究方向。