推荐系统为用户和企业都创造了巨大的价值,因此在学术界和产业界都引起了广泛关注。然而,由于现实约束,学术研究大多仍局限于离线数据集的优化,缺乏对真实用户数据和大规模推荐平台的访问。这一局限降低了研究的现实相关性,减缓了技术进步,并阻碍了对推荐系统关键挑战的全面理解。在本综述中,我们系统性地回顾了产业界的推荐系统,并与学术界的对应研究进行了对比。我们重点突出了在数据规模、实时性需求和评估方法上的关键差异,并总结了主要的真实推荐场景及其相关挑战。接着,我们探讨了产业实践者如何在交易导向型推荐系统与内容导向型推荐系统中应对这些挑战,这一新的分类方法基于物品特征和推荐目标。最后,我们提出了若干有前景的研究方向,包括经常被忽视的用户决策作用、经济学与心理学理论的融合,以及推动学术研究进步的具体建议。我们的目标是加强学术界对实际推荐系统的理解,弥合日益扩大的发展鸿沟,并促进产业界与学术界的更紧密合作。 CCS 分类: • 信息系统 → 推荐系统。 附加关键词: 产业推荐系统、实际挑战、学术–产业鸿沟
近年来,移动应用与互联网的广泛普及带来了碎片化用户会话的大量涌现,以及用户与在线服务更为频繁的交互。内容的爆炸式增长使得信息能够主动找到目标受众变得愈发重要。由此,推荐技术逐渐成为关键的解决方案。 这一趋势已经在多个领域得到验证。电商平台(如 Amazon [21, 150] 与阿里巴巴 [53, 56])、内容平台(如 YouTube [118, 166]、HBO Max [28] 与 Netflix [133])、以及音乐服务(如 Spotify [7, 102])都依靠多样化的推荐策略实现了显著增长。更为突出的是,短视频平台(如抖音与 TikTok [31]、快手 [27, 106]、以及 Instagram Reels [164])已经重塑了移动互联网的消费习惯,而推荐系统正是其核心驱动力。此外值得注意的是,绩效驱动的在线广告作为互联网经济最重要的收入来源之一,本质上也依赖推荐技术构建。从这一意义上说,推荐系统不仅是当今数字生态中不可或缺的组成部分,也是互联网发展史上的技术基石。 推荐系统(RecSys)的研究已有数十年历史。即使在今天,我们仍然不断看到新颖的方法发表在顶级会议和期刊上。然而,这些学术研究方法能否直接应用于、或仅需较小改动即可迁移到真实工业环境,仍是一个存在争议的问题。更为根本的是,学术界与产业界所追求的目标往往本质不同。学术研究通常强调方法上的创新:在公开数据集上取得更高精度(precision)、召回率(recall)或 NDCG 的模型,常被视为有价值的贡献。相较之下,产业应用则更注重业务导向指标:一种方法能否带来实际或隐性的收益提升,例如收入、用户参与度或系统效率。这造成了完全不同的评估范式。工业部署还必须仔细权衡工程约束、系统成本和性能折衷。更重要的是,除了离线验证外,模型还必须在真实环境中经过严格的 A/B 测试,以确认其实际效果。这就形成了一种根本张力:学术研究往往关注在较为宽松的约束下推动算法性能的提升,而工业系统则优先考虑在运营、财务和组织等复杂约束中实现整体业务价值。这些差异因数据规模、实时响应要求、部署条件,甚至基线定义上的差距而进一步加剧。因此,学术界和产业界在推荐系统有效性的定义和评估上经常存在分歧。 为了帮助学术研究者更好地理解推荐系统在真实部署中的实际挑战,并为进入产业的开发者提供先进技术指引,我们对过去五年(2020–2024)发表的产业推荐相关论文进行了全面回顾。我们的综述总结了产业推荐系统面临的共性挑战,包括大规模数据处理、实时约束、响应延迟,以及训练与推理成本。此外,我们将推荐生态分解为两个主要类别:交易导向型推荐系统(Transaction-Oriented RecSys,如电商)与内容导向型推荐系统(Content-Oriented RecSys,如视频、新闻与音乐),并分析其独特的业务目标与算法策略。最后,我们指出了推荐系统学术研究中若干有前景的方向,尤其是用户行为理解与理论引导的生产环境优化——我们认为这是该领域最有意义的追求之一。
作为一个相对成熟的研究领域,推荐系统已有大量深入的综述。一些工作系统讨论了特定的技术范式 [176] 与方法论 [78],另一些则全面考察了不同应用领域 [94]。这些综述极大地方便了读者快速把握特定方向上的进展。然而,我们注意到一个明显缺失:尚无系统性地聚焦于真实世界推荐系统的综述。尤其是产业中的实际挑战、应用场景、方法学考量与评估标准,与学术研究有着显著差异,但在现有文献中缺乏系统分析。毕竟,大多数学术研究的动机、灵感与最终目标,都是面向现实中部署的推荐系统。 因此,我们识别出一个关键缺口:迫切需要在学术界与产业界之间建立理解桥梁。在推荐系统领域,学术研究与产业实践的轨迹正日益分化——这一趋势甚至比其他技术领域更加明显。我们的工作正是为弥补这一缺口而展开,旨在提供对产业实践、挑战与评估指标的全面分析,以促进学术与产业的对齐并激发未来创新。
首先,我们从 SIGIR、RecSys、WWW、WSDM、KDD 和 CIKM 等主要会议中收集了推荐系统相关论文,时间范围限定在过去五年(2020–2024)。随后,我们以作者身份作为关键筛选条件,要求至少有一位作者来自产业界,以此识别产业推荐系统相关研究。因为单纯的学术作者通常缺乏构建生产级推荐系统的机会。然而,我们发现一些完全由产业研究者撰写的论文仍仅依赖公共数据集和离线实验,缺乏实际生产应用。遵循实用性原则,我们进一步筛选出那些通过线上 A/B 测试验证方法的论文,这是应用型推荐系统的必要环节,最终将样本缩小到 272 篇论文。 本综述基于对这些论文的深入探索与分类。在分类过程中,我们唯一的标准是该方法通过线上 A/B 测试验证的业务场景。例如,即便某个方法在多个领域的离线数据集上都有提升(如电商、电影、音乐),但如果其线上 A/B 验证仅在电商场景中进行,我们便将其归类为电商推荐系统。 需要说明的是,虽然广告技术与推荐系统有许多共通点,但其底层逻辑更为复杂,且在产业部署中存在独特考量。因此,我们在本综述中有意排除广告方向,最终得到 228 篇论文作为研究对象。
本综述系统总结了推荐系统从研究实验室走向商业应用过程中面临的挑战,并全面展现了产业实践者如何在庞大的数据与用户规模下实现高效的信息匹配。如图 1 所示,我们分析了不同推荐场景中用户行为与数据特征的差异,从而揭示了不同优化方向背后的根本原因。首先,我们将真实世界推荐系统划分为两大类: 定义 1(交易导向型推荐系统)
交易导向型推荐系统的主要目标是促使用户完成交易行为,优化转化率、收入或购买可能性等指标。其设计初衷是鼓励用户完成特定交易(如购买、预订或订阅)。核心目标是最大化可量化的商业结果(如收入、转化率、平均订单价值),通过历史交易数据、用户行为模式和预测模型来推荐具有高转化概率的商品或服务。电商平台是典型的交易导向型推荐系统。
定义 2(内容导向型推荐系统)
内容导向型推荐系统的主要目标是促进用户消费与互动,优化停留时间、点击率或用户满意度等指标,而非交易结果。其设计重点在于通过即时提供相关内容(如新闻、视频、音乐),提升用户参与度与满意度。与交易导向型系统不同,其核心目标并非推动购买,而是最大化与持续消费相关的指标(如点击、观看时长、阅读时长)。为此,内容导向型推荐系统通常结合丰富的内容特征、用户偏好与行为信号,实现个性化推荐,动态适应兴趣演化并促进长期用户互动。 在这两大类别下,我们归纳了产业界为优化推荐系统所采用的方法,帮助读者理解学术算法与实际部署之间的差距。因此,本综述既能为学术研究者提供深入的产业洞见,启发与实际需求紧密结合的新理论研究方向,同时也能为产业实践者总结相似语境下可应用或可改进的实用技术,助力实现更大的商业成功。 需要注意的是,推荐系统已深度融入各行各业,远远超出本文讨论的在线交易与内容场景。然而,在我们收集的论文中,较少有在 POI [23]、游戏 [38]、直播 [76]、社交社区 [66, 117, 121, 125, 178]、以及招聘 [45, 189] 等场景通过 A/B 测试验证的研究,因此这些领域的推荐不在本综述的覆盖范围之内。 本文余下部分安排如下:第 2 节概述推荐系统在产业中的应用,包括代表性用例、关键业务指标,以及特定方法为何能够有效应对独特数据挑战的原因。第 3 与第 4 节详细讨论产业推荐系统的两大类:交易导向型推荐系统与内容导向型推荐系统,分别从数据规模、实时性、响应延迟、训练与推理成本,以及评估方法等方面进行分析,突出学术方法与真实世界应用之间的差距。第 5 节从学术角度反思推荐系统未来的研究方向。最后,第 6 节总结本综述,倡导通过务实的方法将学术进展转化为产业落地成果,从而推动整个领域的发展。