Recommendation models that utilize unique identities (IDs) to represent distinct users and items have been state-of-the-art (SOTA) and dominated the recommender systems (RS) literature for over a decade. Meanwhile, the pre-trained modality encoders, such as BERT and ViT, have become increasingly powerful in modeling the raw modality features of an item, such as text and images. Given this, a natural question arises: can a purely modality-based recommendation model (MoRec) outperforms or matches a pure ID-based model (IDRec) by replacing the itemID embedding with a SOTA modality encoder? In fact, this question was answered ten years ago when IDRec beats MoRec by a strong margin in both recommendation accuracy and efficiency. We aim to revisit this `old' question and systematically study MoRec from several aspects. Specifically, we study several sub-questions: (i) which recommendation paradigm, MoRec or IDRec, performs better in practical scenarios, especially in the general setting and warm item scenarios where IDRec has a strong advantage? does this hold for items with different modality features? (ii) can the latest technical advances from other communities (i.e., natural language processing and computer vision) translate into accuracy improvement for MoRec? (iii) how to effectively utilize item modality representation, can we use it directly or do we have to adjust it with new data? (iv) are there some key challenges for MoRec to be solved in practical applications? To answer them, we conduct rigorous experiments for item recommendations with two popular modalities, i.e., text and vision. We provide the first empirical evidence that MoRec is already comparable to its IDRec counterpart with an expensive end-to-end training method, even for warm item recommendation. Our results potentially imply that the dominance of IDRec in the RS field may be greatly challenged in the future.


翻译:推荐系统普遍采用利用唯一身份标识符(ID)表示不同用户和物品的推荐模型,这一方法已经成为了长达十年的主流和最先进的技术,并且一直占据着推荐系统领域的主导地位。与此同时,利用预训练的模态编码器,比如BERT和ViT等,来建模物品的原始模态特征,比如文本和图像的方法也变得越来越强大。鉴于此,一个自然而然的问题就出现了:是否可以使用单纯的基于模态性的推荐模型(MoRec)通过替换物品ID嵌入以及采用先进的模态编码器超越或者匹敌基于ID的纯粹推荐模型(IDRec)呢?实际上,这个问题10年前就被回答了,当时IDRec显著地击败了MoRec,无论是在推荐准确率还是效率上。我们的研究旨在重新考虑这个‘旧’问题,并从几个方面系统地研究MoRec的性能。具体来说,我们主要研究以下几个子问题:(i)在实际场景中,哪种推荐模型更优秀,MoRec还是IDRec,特别是在IDRec具有强大优势的通用设置或热门物品场景?对于具有不同模态特征的物品,这种情况是否仍然成立?(ii)其他领域(例如自然语言处理和计算机视觉)中的最新技术进展是否能够转化为MoRec的准确度提高?(iii)如何有效利用物品模态表示,我们能够直接使用它吗,还是必须使用新数据进行调整?(iv)MoRec在实际应用中是否存在关键挑战?为了回答这些问题,我们开展了严格的实验,对利用两种流行模态,即文本和视觉进行物品推荐的模型进行了测试。我们首次提供了经验证据,MoRec可以在代价昂贵的端到端训练方法下,与其IDRec对应物媲美,甚至适用于热门物品推荐场景。这些结果预示着,在未来,IDRec在推荐系统领域的主导地位可能会受到极大的挑战。

0
下载
关闭预览

相关内容

专知会员服务
22+阅读 · 2020年9月8日
【KDD2020-Tutorial】自动推荐系统,Automated Recommendation System
推荐系统多任务学习上分技巧
机器学习与推荐算法
0+阅读 · 2022年10月19日
TransRec: 基于混合模态反馈的可迁移推荐系统
机器学习与推荐算法
0+阅读 · 2022年7月13日
一文梳理推荐系统中的多任务学习
机器学习与推荐算法
8+阅读 · 2022年6月15日
SIGIR2022 | 从Prompt的角度考量强化学习推荐系统
机器学习与推荐算法
1+阅读 · 2022年5月24日
IJCAI2022推荐系统论文集锦
机器学习与推荐算法
0+阅读 · 2022年5月20日
稠密检索模型的zero-shot能力究竟如何?
RUC AI Box
0+阅读 · 2022年4月28日
推荐中的序列化建模:Session-based neural recommendation
机器学习研究会
18+阅读 · 2017年11月5日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
159+阅读 · 2023年4月20日
VIP会员
相关VIP内容
专知会员服务
22+阅读 · 2020年9月8日
【KDD2020-Tutorial】自动推荐系统,Automated Recommendation System
相关资讯
推荐系统多任务学习上分技巧
机器学习与推荐算法
0+阅读 · 2022年10月19日
TransRec: 基于混合模态反馈的可迁移推荐系统
机器学习与推荐算法
0+阅读 · 2022年7月13日
一文梳理推荐系统中的多任务学习
机器学习与推荐算法
8+阅读 · 2022年6月15日
SIGIR2022 | 从Prompt的角度考量强化学习推荐系统
机器学习与推荐算法
1+阅读 · 2022年5月24日
IJCAI2022推荐系统论文集锦
机器学习与推荐算法
0+阅读 · 2022年5月20日
稠密检索模型的zero-shot能力究竟如何?
RUC AI Box
0+阅读 · 2022年4月28日
推荐中的序列化建模:Session-based neural recommendation
机器学习研究会
18+阅读 · 2017年11月5日
相关基金
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员