递归神经网络已被证明可以有效地建模推荐系统的连续用户反馈。然而,它们通常只关注项目的相关性,而不能有效地为用户探索不同的项目,因此从长远来看会损害系统性能。为了解决这一问题,我们提出了一种新的递归神经网络,称为递归探索网络(re - exploration networks, REN),该网络可以联合执行表征学习和潜在空间的有效探索。REN试图平衡相关性和探索,同时考虑到表现中的不确定性。我们的理论分析表明,即使在学习的表征中存在不确定性,REN仍能保持最优率的次线性遗憾。我们的实证研究表明,REN可以在合成和真实的推荐数据集上获得令人满意的长期回报,优于最先进的模型。
https://www.zhuanzhi.ai/paper/4b73b324ed99c6efe645d865c83fa1c1