项目名称: 基于机器学习的相关反馈算法中若干关键问题研究

项目编号: No.61300117

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 叶正

作者单位: 杭州电子科技大学

项目金额: 23万元

中文摘要: 伪相关反馈是解决信息检索过程中词不匹配问题的有效手段,是提高信息检索准确率和召回率的关键技术之一。在传统基于查询扩展的伪相关反馈技术中,由于假设初次检索得到前K篇文档为相关文档,使得1)当初次检索返回文档集质量不高时,容易引入噪音;2)不同质量反馈文档无法区分对待。本课题重新审视伪相关反馈的基础假设,研究如何挖掘网络资源和使用机器学习技术来解决伪相关反馈中若干关键问题,进一步提高基于查询扩展的相关反馈技术的性能:1)引入新的基于质量偏重相关反馈假设,并提出面向相关反馈文档质量评估模型;2)引入新的基于主题相关反馈假设,并提出查询相关反馈主题提取算法;3)提出基于多种外部资源的反馈模型,解决首次查询精度较差时,反馈文档质量无法得到保证的问题。

中文关键词: 文档质量评估;相关反馈;机器学习;排序学习;

英文摘要: Pseudo Relevance Feedback (PRF) is an effective technique for solving the term mismatching problem in Information Retrieval(IR). In traditional PRF models, the top K documents from the first-pass retrieval are assumed to be relevant. This assumption may cause: 1) when the quality of the feedback document set is low, noise will be brought in the reformulated query; 2) documents with different quality level are treated in the same way while they have different impact to PRF model in reality. In this research, we propose to use machine learning and web mining techniques to address the above problems. In particular, 1) we present a new assumption for PRF, and propose a quality-biased PRF retrieval framework; 2) we present a new topic-based assumption, and proposed a topic-based PRF model and query-related topic extraction models; 3) propose an external resource based PRF model to address the problem of low quality of feedback documents.

英文关键词: Document Quality Estimation;Relevance Feedback;Machine Learning;Learning to Rank;

成为VIP会员查看完整内容
1

相关内容

机器学习中原型学习研究进展
专知会员服务
45+阅读 · 2022年1月18日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
28+阅读 · 2021年12月3日
面向任务型的对话系统研究进展
专知会员服务
56+阅读 · 2021年11月17日
专知会员服务
20+阅读 · 2021年8月1日
专知会员服务
20+阅读 · 2021年7月19日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
42+阅读 · 2020年12月9日
个性化推荐系统技术进展
专知会员服务
65+阅读 · 2020年8月15日
基于知识图谱的推荐系统研究综述
专知会员服务
319+阅读 · 2020年8月10日
【机器学习课程】机器学习中的常识性问题
专知会员服务
72+阅读 · 2019年12月2日
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
知识驱动的推荐系统:现状与展望
专知
1+阅读 · 2021年11月22日
机器学习中的数据级联
TensorFlow
0+阅读 · 2021年7月15日
事实抽取与验证研究综述
专知
0+阅读 · 2021年4月20日
文本情感分析方法研究综述
专知
4+阅读 · 2021年4月20日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
从浅层模型到深度模型:概览机器学习优化算法
机器之心
23+阅读 · 2017年7月9日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
1+阅读 · 2022年4月18日
Quantum Computing -- from NISQ to PISQ
Arxiv
1+阅读 · 2022年4月15日
小贴士
相关VIP内容
机器学习中原型学习研究进展
专知会员服务
45+阅读 · 2022年1月18日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
28+阅读 · 2021年12月3日
面向任务型的对话系统研究进展
专知会员服务
56+阅读 · 2021年11月17日
专知会员服务
20+阅读 · 2021年8月1日
专知会员服务
20+阅读 · 2021年7月19日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
42+阅读 · 2020年12月9日
个性化推荐系统技术进展
专知会员服务
65+阅读 · 2020年8月15日
基于知识图谱的推荐系统研究综述
专知会员服务
319+阅读 · 2020年8月10日
【机器学习课程】机器学习中的常识性问题
专知会员服务
72+阅读 · 2019年12月2日
相关资讯
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
知识驱动的推荐系统:现状与展望
专知
1+阅读 · 2021年11月22日
机器学习中的数据级联
TensorFlow
0+阅读 · 2021年7月15日
事实抽取与验证研究综述
专知
0+阅读 · 2021年4月20日
文本情感分析方法研究综述
专知
4+阅读 · 2021年4月20日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
从浅层模型到深度模型:概览机器学习优化算法
机器之心
23+阅读 · 2017年7月9日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员