因果如何用于推荐？弗吉尼亚大学最新《推荐系统中的因果推理:偏差缓解、解释和泛化策略》综述

在信息过载的时代，推荐系统(RSs)已经成为在线服务平台不可或缺的一部分。传统的RSs通过观察用户的历史活动、用户画像和交互项目内容之间的相关性来估计用户的兴趣并预测其未来的行为。然而，由于没有考虑导致观察到的用户行为的内在因果原因，生成的推荐可能存在多种类型的偏差。此外，驱动用户活动的因果动机通常纠缠在这些RSs中，无法保证推荐的可解释性和泛化能力。为了解决这些缺点，近年来人们对用因果推理技术增强传统RSs的兴趣激增。本综述提供了因果RSs的系统概述，帮助读者全面了解这一有前途的领域。从传统RSs的基本概念及其由于缺乏因果推理能力而产生的局限性开始。讨论了如何引入不同的因果推理技术来解决这些挑战，重点是去偏差、提高可解释性和提高泛化能力。彻底分析了因果RSs的各种评估策略，特别是在利益的因果影响不可用的情况下，如何用有偏的数据可靠地估计它们的性能。最后，对未来因果关系研究的潜在方向进行了展望。

1. 引言

随着web上的信息呈指数级增长，推荐系统(RSs)在现代在线服务中扮演着越来越重要的角色，因为它能够根据用户的个性化兴趣自动地向他们提供商品**。

传统RSs主要可以分为三类[9]:基于协同过滤的方法[10]、基于内容的方法[11]和混合方法[12]。基于协同过滤的RSs利用用户过去的浏览、点击、购买等行为来估计用户的兴趣并预测其未来的行为。另一方面，基于内容的方法通过匹配用户兴趣和项目内容来预测新的推荐。混合方法结合了两者的优势，综合考虑了协同信息和用户/项目特征信息，产生更准确的推荐。尽管近年来上述三类RSs都取得了巨大的成就，但这些方法的一个很大的局限性是，它们只能根据观察到的用户历史行为和用户/项目特征中的相关性来估计用户兴趣并预测未来的推荐，这不能保证因果关系[13,14]。

例如，基于协同过滤的RS可能会发现某种类型的几个电视剧倾向于从一组用户中获得高评分，并得出结论，我们应该不断向这些用户推荐相同类型的电视剧。但有一个重要的问题:高收视率是由于用户确实喜欢该类型的电视剧，还是由于用户接触到的同一类型的电视剧有限(即曝光偏差)，如果有机会，他们会更喜欢看新的节目?此外，基于内容的RS可以观察到具有某些特征的微视频与更多的点击相关联，并得出这些特征可能反映了当前用户兴趣的趋势。但点击量之所以如此之高，是因为这些微视频往往具有耸人听闻的标题，容易让用户上当受骗吗?此外，如果这些微视频的标题改为反映其真实内容的标题，用户还会点击它们吗?上述问题在本质上是因果的，因为它们要么询问干预的效果(例如，如果一个新的电视剧展示给用户，评分将是什么)，要么询问反事实的结果(例如，如果微视频的标题更改以忠实地反映内容，用户还会点击它吗)，而不仅仅是观察数据中的关联。Pearl[15]认为，这些问题位于因果关系阶梯的第2级和第3级，即干预推理和反事实推理，而传统的RSs不能回答这些问题，即仅用位于阶梯第1级的关联进行推理。为什么这些因果问题对RSs很重要?第一个原因是，如果不解决这些问题，很容易在推荐中产生偏差，而这种偏差会被很长一段时间忽视。如果上述基于协同过滤的RSs错误地揭示了用户兴趣的暴露偏差，则会通过不断向用户推荐相似的项目来放大该偏差;最终，推荐将失去偶然性，用户的在线体验可能会严重下降。同样的，对于基于内容的微视频RSs来说，如果不能区分用户兴趣引起的点击和被标题党欺骗的点击，就会过度推荐标题耸人听闻的微视频，这对那些花费大量精力设计内容的优质微视频上传者是不公平的。此外，了解用户活动的原因有助于提高推荐的可解释性。考虑一个因果问题，用户购买商品是出于质量还是价格低廉。寻求用户行为背后的因果解释可以帮助服务提供商根据用户的个性化偏好增强RS算法。因果推断能够识别稳定不变的因果关系，并在此基础上提出建议，同时丢弃不受欢迎或容易变化的其他相关性。以推荐餐厅为例。用户选择餐馆可能是因为方便(例如，去附近的快餐店快速地吃点东西，但他们不一定喜欢，非稳定相关)或由于个人兴趣(例如，出差很远的地方去火锅店，稳定的因果关系)。如果RS能恰当地解析出影响用户之前光顾餐厅的意图，即使不同餐厅的便利性水平可能因各种内部或外部原因(如用户搬到新地方)而发生变化，系统仍能很好地适应新情况。从这个角度来看，因果RSs的泛化能力可以得到大幅提升。

本综述对因果RS研究的最新进展进行了系统的概述。组织结构如图1所示。在第2节中，我们从传统RSs的基本概念及其相关推理的局限性开始。第3节回顾了机器学习和统计学中两个重要的因果推理范式，并展示了它们与推荐任务的联系。第4节深入讨论了如何引入不同的因果推理技术来解决传统RSs的局限性，重点是去偏倚、可解释性的提高和泛化能力的提高。第5节总结了因果RSs的一般评估策略。最后，第6和第7节讨论了因果性RSs的前瞻性开放问题和未来方向，并总结了本综述。

2. 因果推荐系统

基于前几节讨论的RSs和因果推断的初步知识，我们准备介绍最先进的因果RSs。重点关注了三个重要的主题，即偏差缓解、可解释性提高和泛化能力的提高，以及它们的相互联系，其中可以很好地解决由于相关推理而传统RSs的各种限制。传统RSs的关联推理可以继承用户观察行为中的多种类型偏差，并在未来的推荐[46]中放大这些偏差。这些偏差可能会导致各种后果，如离线评估与在线指标之间的差异、多样性的丧失、推荐质量的降低、攻击性的推荐等。因果推断可以区分稳定的因果关系和可能对推荐产生负面影响的虚假关联和偏差，从而提高推荐的鲁棒性。在前几节中，我们介绍了因果关系，以解决传统RSs的各种类型的偏差和虚假相关性问题。在本节中，我们使用因果关系来解释用户决策过程。具体来说，我们讨论了一个有趣的问题，旨在解开用户的意图，从而解释他们过去的行为，即用户购买一件物品是因为她符合当前的趋势还是因为她真的喜欢它?这个问题的棘手之处在于:在现实中，我们只观察到影响，即购买，这两个原因都可以解释。

在从潜在偏差和纠缠的观察数据集中估计因果关系之后，RSs的泛化能力可以得到显著增强，因为即使我们进行推荐的上下文(或环境)发生了变化(例如，项目流行度、用户从众性等)，我们仍然可以根据稳定和不变的因果关系来进行推荐。同时丢弃或纠正其他瞬时的、易受变化影响的不良相关性[56,93]。在本节中，我们使用用于流行度偏差的PD算法和用于因果可解释性的DICE算法作为两个例子，来展示如何通过因果干预和解缠来提高RSs的泛化性。

参考文献：

Jiahui Liu, Peter Dolan, and Elin Rønby Pedersen. Personalized news recommendation based on click behavior. In Proceedings of the 15th International Conference on Intelligent User Interfaces, pages 31–40, 2010.
Ioannis Paparrizos, B Barla Cambazoglu, and Aristides Gionis. Machine learned job recommendation. In Proceedings of the 5th ACM Conference on Recommender Systems, pages 325–328, 2011.

成为VIP会员查看完整内容