题目:

Mining Implicit Relevance Feedback from User Behavior for Web Question Answering

简介:

训练和刷新用于多语言商业搜索引擎的Web级问答系统通常需要大量的数据。一个想法是从搜索引擎日志中记录的用户行为从而挖掘隐式相关性。以前所有有关挖掘隐式相关性的著作都将反馈的目标指定为Web文档的相关性。由于QA任务中的几个独特特性,现有的Web文档用户行为模型无法应用于推断段落相关性。在本文中,我们进行了第一项研究,以探索用户行为与段落之间的相关性,并提出了一种挖掘Web QA训练数据的方法。我们对四个测试数据集进行了广泛的实验,结果表明,在没有人标记的数据中,我们的方法显着提高了段落排名的准确性。实际上,已证明这项工作有效地降低了全球商业搜索引擎中质量检查服务的人工标记成本,尤其是对于资源较少的语言。

成为VIP会员查看完整内容
34

相关内容

【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
35+阅读 · 2020年4月5日
【反馈循环自编码器】FEEDBACK RECURRENT AUTOENCODER
专知会员服务
22+阅读 · 2020年1月28日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
102+阅读 · 2019年1月9日
肖仰华 | 基于知识图谱的用户理解
开放知识图谱
13+阅读 · 2017年9月29日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
7+阅读 · 2018年11月29日
Arxiv
14+阅读 · 2018年4月18日
Arxiv
6+阅读 · 2018年3月28日
VIP会员
相关VIP内容
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
35+阅读 · 2020年4月5日
【反馈循环自编码器】FEEDBACK RECURRENT AUTOENCODER
专知会员服务
22+阅读 · 2020年1月28日
微信扫码咨询专知VIP会员