【WSDM2021】统一在线与反事实的排序学习

2020 年 12 月 14 日 专知


基于用户交互来优化排名系统是一个被广泛研究的问题。基于用户交互的优化排名系统的最先进方法分为在线方法(通过直接与用户交互进行学习)和反事实方法(通过历史交互进行学习)。现有的在线方法在没有在线干预的情况下会受到阻碍,因此不应该被用到反事实方法中。相反,反事实的方法不能直接从在线干预中获益。我们提出了一种新的干预感知估计器,用于反事实和在线学习排序(LTR)。随着干预感知估计器的引入,我们的目标是连接在线/反事实LTR部门,因为它在在线和反事实场景中都被证明是非常有效的。通过使用基于日志策略行为和在线干预(在收集点击数据期间对日志策略所做的更改)的校正,估计器可以校正位置偏差、信任偏差和项目选择偏差的影响。我们的实验结果,在一个半合成的实验设置中进行,结果表明,不像现有的反事实LTR方法,干预感知估计器可以从在线干预大大获益。


https://www.zhuanzhi.ai/paper/a7538e130a7fc65679e6e7d950bb4016



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“OCLR” 就可以获取【WSDM2021】统一在线与反事实的排序学习》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

【CVPR2021】反事实的零次和开集识别
专知会员服务
25+阅读 · 2021年5月7日
专知会员服务
32+阅读 · 2021年4月6日
专知会员服务
12+阅读 · 2021年3月13日
【WWW2021】场矩阵分解机推荐系统
专知会员服务
31+阅读 · 2021年2月27日
【NeurIPS2020】因果推断学习教程,70页ppt
专知会员服务
189+阅读 · 2020年12月12日
[WSDM2021]用于边缘流异常检测的频率因子分解
专知会员服务
11+阅读 · 2020年11月24日
【CIKM2020-阿里】在线序列广告的用户隐藏状态推断
专知会员服务
24+阅读 · 2020年9月5日
Arxiv
12+阅读 · 2020年6月20日
Arxiv
110+阅读 · 2020年2月5日
Arxiv
23+阅读 · 2018年8月3日
Arxiv
3+阅读 · 2017年12月18日
VIP会员
相关VIP内容
【CVPR2021】反事实的零次和开集识别
专知会员服务
25+阅读 · 2021年5月7日
专知会员服务
32+阅读 · 2021年4月6日
专知会员服务
12+阅读 · 2021年3月13日
【WWW2021】场矩阵分解机推荐系统
专知会员服务
31+阅读 · 2021年2月27日
【NeurIPS2020】因果推断学习教程,70页ppt
专知会员服务
189+阅读 · 2020年12月12日
[WSDM2021]用于边缘流异常检测的频率因子分解
专知会员服务
11+阅读 · 2020年11月24日
【CIKM2020-阿里】在线序列广告的用户隐藏状态推断
专知会员服务
24+阅读 · 2020年9月5日
相关论文
Arxiv
12+阅读 · 2020年6月20日
Arxiv
110+阅读 · 2020年2月5日
Arxiv
23+阅读 · 2018年8月3日
Arxiv
3+阅读 · 2017年12月18日
Top
微信扫码咨询专知VIP会员