位置偏差是信息检索中处理隐式但有偏差的用户反馈数据的关键问题。无偏排序方法通常依赖于因果关系模型,并通过反倾向加权消除用户反馈的偏差。这些方法虽然实用,但仍存在两个主要问题。首先,在推断用户单击时,上下文信息(如已检查的文档)的影响常常被忽略。第二,只考虑了位置偏差,忽略了用户浏览行为引起的其他问题。在本文中,我们提出了一个端到端的深度递归生存排序(DRSR),一个统一的框架来联合建模用户的各种行为,以 (i)考虑排序列表中丰富的上下文信息; (ii)解决隐藏在用户行为背后的问题,即,在没有任何点击的查询中挖掘观察模式(非点击查询),对不能真实反映用户浏览意图的跟踪日志进行建模(不可信观察)。具体来说,我们采用递归神经网络来建模上下文信息,并估计用户在每个位置反馈的条件似然。然后,我们将生存分析技术与概率链式法则相结合,以数学方式恢复一个用户的各种行为的无偏联合概率。DRSR可以很容易地与点和成对的学习目标结合起来。对两个大型工业数据集的大量实验表明,我们的模型与最先进的技术相比,具有显著的性能增益。
https://arxiv.org/abs/2004.14714
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DRSM” 就可以获取《【SIGIR2020-上海交大】一个深度循环生存模型的无偏排序,A Deep Recurrent Survival Model》专知下载链接