题目: Policy-Aware Unbiased Learning to Rank for Top-𝑘 Rankings

摘要:

反事实学习排序(LTR)方法使用包含交互偏差的登录用户交互来优化排序系统。只有当用户在每个排序中都能看到所有相关的条目时,现有的方法才是公正的。目前还没有现有的反事实的无偏LTR的top-K排序的方法。文中引入了一种新的策略感知的LTR度量的反事实估计器,它可以解释随机测井策略的影响。如果每个相关项目都有一个非零概率出现在top-K排名中,就可以证明policy-aware估计量是无偏 我们的实验结果表明,估计量的性能不受𝑘大小的影响:对于任何𝑘,policy-aware估计量达到相同的检索性能,同时学习从top-K中反馈完整的排序。最后,将介绍扩展传统的LTR方法执行反事实的LTR和优化前𝑘指标。文中主要贡献主要有介绍第一个policy-aware无偏LTR方法,学习从top-𝑘反馈和优化前𝑘指标。因此,反事实的LTR现在普遍适用于搜索和推荐中的top-𝑘排序。

成为VIP会员查看完整内容
27

相关内容

【SIGIR2020】用于冷启动推荐的内容感知神经哈希
专知会员服务
23+阅读 · 2020年6月2日
【SIGIR2020-微软】知识图谱上的增强推荐推理
专知会员服务
75+阅读 · 2020年5月30日
【SIGIR2020】学习词项区分性,Learning Term Discrimination
专知会员服务
16+阅读 · 2020年4月28日
【新书】深度学习搜索,Deep Learning for Search,附327页pdf
专知会员服务
211+阅读 · 2020年1月13日
深度学习的下一步:Transformer和注意力机制
云头条
56+阅读 · 2019年9月14日
初学者系列:推荐系统Wide & Deep Learning详解
自动驾驶汽车技术路线简介
智能交通技术
15+阅读 · 2019年4月25日
腊月廿八 | 强化学习-TRPO和PPO背后的数学
AI研习社
17+阅读 · 2019年2月2日
干货|浅谈强化学习的方法及学习路线
机器学习算法与Python学习
16+阅读 · 2018年3月28日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
【强化学习】强化学习+深度学习=人工智能
产业智能官
54+阅读 · 2017年8月11日
Arxiv
3+阅读 · 2018年10月5日
Learning to Focus when Ranking Answers
Arxiv
5+阅读 · 2018年8月8日
Arxiv
5+阅读 · 2018年3月28日
Arxiv
6+阅读 · 2018年1月11日
VIP会员
相关资讯
深度学习的下一步:Transformer和注意力机制
云头条
56+阅读 · 2019年9月14日
初学者系列:推荐系统Wide & Deep Learning详解
自动驾驶汽车技术路线简介
智能交通技术
15+阅读 · 2019年4月25日
腊月廿八 | 强化学习-TRPO和PPO背后的数学
AI研习社
17+阅读 · 2019年2月2日
干货|浅谈强化学习的方法及学习路线
机器学习算法与Python学习
16+阅读 · 2018年3月28日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
【强化学习】强化学习+深度学习=人工智能
产业智能官
54+阅读 · 2017年8月11日
微信扫码咨询专知VIP会员