Multi-armed bandits (MAB) provide a principled online learning approach to attain the balance between exploration and exploitation. Due to the superior performance and low feedback learning without the learning to act in multiple situations, Multi-armed Bandits drawing widespread attention in applications ranging such as recommender systems. Likewise, within the recommender system, collaborative filtering (CF) is arguably the earliest and most influential method in the recommender system. Crucially, new users and an ever-changing pool of recommended items are the challenges that recommender systems need to address. For collaborative filtering, the classical method is training the model offline, then perform the online testing, but this approach can no longer handle the dynamic changes in user preferences which is the so-called cold start. So how to effectively recommend items to users in the absence of effective information? To address the aforementioned problems, a multi-armed bandit based collaborative filtering recommender system has been proposed, named BanditMF. BanditMF is designed to address two challenges in the multi-armed bandits algorithm and collaborative filtering: (1) how to solve the cold start problem for collaborative filtering under the condition of scarcity of valid information, (2) how to solve the sub-optimal problem of bandit algorithms in strong social relations domains caused by independently estimating unknown parameters associated with each user and ignoring correlations between users.


翻译:多武装匪徒(MAB)提供了一种原则性在线学习方法,以实现勘探与开发之间的平衡。由于业绩优异,反馈学习低,而没有学习如何在多种情况下采取行动,多武装匪徒在建议系统等应用程序中引起广泛关注。同样,在推荐者系统中,合作过滤(CF)可以说是推荐者系统中最早和最有影响力的方法。关键的是,新用户和不断变化的推荐项目库是建议者系统需要应对的两种挑战。对于协作过滤,传统方法是培训模型脱线,然后进行在线测试,但这一方法不再能够处理用户偏好的动态变化,即所谓的寒冷开端。因此,如何在缺乏有效信息的情况下有效地向用户推荐项目?为了解决上述问题,提出了以多武装土匪协作过滤建议系统为基础的协作过滤系统,称为BanditMF。MF旨在解决多武装匪徒算法和协作过滤中的两项挑战:(1) 如何在有效信息稀缺的情况下解决协作过滤的冷开始问题,然后进行在线测试,但这一方法无法再处理用户偏好。(2) 如何在缺乏有效信息的情况下,在缺乏有效信息的情况下,有效地向用户推荐者推算,如何独立地解决每个用户之间以不为主的相对关系中,如何以独立地计算,如何解决与无比重的系统之间,如何解决与用户关系导致的相对关系之间,如何解决了无比重的代算法问题。

0
下载
关闭预览

相关内容

Meta最新WWW2022《联邦计算导论》教程,附77页ppt
专知会员服务
60+阅读 · 2022年5月5日
专知会员服务
162+阅读 · 2020年1月16日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
VCIP 2022 Call for Special Session Proposals
CCF多媒体专委会
1+阅读 · 2022年4月1日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Interest-aware Message-Passing GCN for Recommendation
Arxiv
12+阅读 · 2021年2月19日
Arxiv
92+阅读 · 2020年2月28日
Arxiv
14+阅读 · 2018年4月18日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员