正确处理丢失的数据是推荐中的一个基本挑战。目前的工作大多是对未观测数据进行负采样,为推荐模型的训练提供负信号。然而,现有的负采样策略,无论是静态的还是自适应的,都不足以产生高质量的负采样——既能提供模型训练的信息,又能反映用户的真实需求。在这项工作中,我们假设项目知识图谱(KG),它提供了丰富的项目和KG实体之间的关系,可以用来推断信息和事实的阴性样本。为此,我们提出了一种新的负采样模型——知识图谱策略网络(KGPolicy),它作为一种强化学习代理来探索高质量的负样本。具体来说,通过我们设计的探索操作,它从目标的正交互中导航,自适应地接收到知识感知的负信号,最终产生一个潜在的负项来训练推荐器。我们在一个配备了KGPolicy的矩阵分解(MF)模型上进行了测试,它在最先进的采样方法(如DNS和IRGAN)和kg增强的推荐模型(如KGAT)上都取得了显著的改进。进一步从不同的角度进行分析,为知识感知抽样提供了思路。我们通过这个https URL发布代码和数据集。
https://www.zhuanzhi.ai/paper/97166b05ea7746278248026677b49ddc
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“RNS” 就可以获取《【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统,Reinforced Negative Sampling》论文专知下载链接