基于机器学习的相关反馈算法中若干关键问题研究 - 专知基金

会员服务 ·

1

文档质量评估 · 相关反馈 · 机器学习 · 排序学习 ·

2013 年 12 月 31 日

基于机器学习的相关反馈算法中若干关键问题研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于机器学习的相关反馈算法中若干关键问题研究

项目编号： No.61300117

项目类型： 青年科学基金项目

立项/批准年度： 2014

项目学科： 自动化技术、计算机技术

项目作者： 叶正

作者单位： 杭州电子科技大学

项目金额： 23万元

中文摘要： 伪相关反馈是解决信息检索过程中词不匹配问题的有效手段，是提高信息检索准确率和召回率的关键技术之一。在传统基于查询扩展的伪相关反馈技术中，由于假设初次检索得到前K篇文档为相关文档，使得1）当初次检索返回文档集质量不高时，容易引入噪音；2）不同质量反馈文档无法区分对待。本课题重新审视伪相关反馈的基础假设，研究如何挖掘网络资源和使用机器学习技术来解决伪相关反馈中若干关键问题，进一步提高基于查询扩展的相关反馈技术的性能：1）引入新的基于质量偏重相关反馈假设，并提出面向相关反馈文档质量评估模型；2）引入新的基于主题相关反馈假设，并提出查询相关反馈主题提取算法；3）提出基于多种外部资源的反馈模型，解决首次查询精度较差时，反馈文档质量无法得到保证的问题。

中文关键词： 文档质量评估；相关反馈；机器学习；排序学习；

英文摘要： Pseudo Relevance Feedback (PRF) is an effective technique for solving the term mismatching problem in Information Retrieval(IR). In traditional PRF models, the top K documents from the first-pass retrieval are assumed to be relevant. This assumption may cause: 1) when the quality of the feedback document set is low, noise will be brought in the reformulated query; 2) documents with different quality level are treated in the same way while they have different impact to PRF model in reality. In this research, we propose to use machine learning and web mining techniques to address the above problems. In particular, 1) we present a new assumption for PRF, and propose a quality-biased PRF retrieval framework; 2) we present a new topic-based assumption, and proposed a topic-based PRF model and query-related topic extraction models; 3) propose an external resource based PRF model to address the problem of low quality of feedback documents.

英文关键词： Document Quality Estimation；Relevance Feedback；Machine Learning；Learning to Rank；

成为VIP会员查看完整内容

1

相关内容

文档质量评估

文档质量评估

机器学习中原型学习研究进展

机器学习中原型学习研究进展

专知会员服务

47+阅读 · 2022年1月18日

【AAAI 2022】使用点反馈与标准离线黑箱算法的在线影响力最大化问题

【AAAI 2022】使用点反馈与标准离线黑箱算法的在线影响力最大化问题

专知会员服务

14+阅读 · 2022年1月16日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知会员服务

30+阅读 · 2021年12月3日

面向任务型的对话系统研究进展

面向任务型的对话系统研究进展

专知会员服务

59+阅读 · 2021年11月17日

【ICML2021】基于数据采样的影响力最大化问题

专知会员服务

21+阅读 · 2021年8月1日

ACL2021 | 探讨跨句事件联合抽取问题

专知会员服务

21+阅读 · 2021年7月19日

【博士论文】搜索引擎中的实体推荐关键技术研究

【博士论文】搜索引擎中的实体推荐关键技术研究

专知会员服务

45+阅读 · 2020年12月9日

个性化推荐系统技术进展

个性化推荐系统技术进展

专知会员服务

66+阅读 · 2020年8月15日

基于知识图谱的推荐系统研究综述

基于知识图谱的推荐系统研究综述

专知会员服务

332+阅读 · 2020年8月10日

【机器学习课程】机器学习中的常识性问题

【机器学习课程】机器学习中的常识性问题

专知会员服务

75+阅读 · 2019年12月2日

机器学习中原型学习研究进展

机器学习中原型学习研究进展

专知

0+阅读 · 2022年1月18日

【AAAI 2022】使用点反馈与标准离线黑箱算法的在线影响力最大化问题

【AAAI 2022】使用点反馈与标准离线黑箱算法的在线影响力最大化问题

专知

0+阅读 · 2022年1月16日

【博士论文】大数据相似查询关键技术研究

【博士论文】大数据相似查询关键技术研究

专知

0+阅读 · 2021年12月2日

知识驱动的推荐系统：现状与展望

知识驱动的推荐系统：现状与展望

专知

1+阅读 · 2021年11月22日

机器学习中的数据级联

机器学习中的数据级联

TensorFlow

0+阅读 · 2021年7月15日

事实抽取与验证研究综述

事实抽取与验证研究综述

专知

0+阅读 · 2021年4月20日

文本情感分析方法研究综述

文本情感分析方法研究综述

专知

4+阅读 · 2021年4月20日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

机器学习研究会

12+阅读 · 2017年11月3日

从浅层模型到深度模型：概览机器学习优化算法

从浅层模型到深度模型：概览机器学习优化算法

机器之心

27+阅读 · 2017年7月9日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向异构物联网的安全融合理论及关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

混沌压缩感知关键基础理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于网络知识和人工知识的图像语义建模方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

维、哈、柯跨语言内容过滤关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

多核学习若干关键问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

多媒体问答中的若干关键问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

结构化机器学习若干关键问题研究

国家自然科学基金

1+阅读 · 2009年12月31日

偏好学习的若干关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于机器学习的软件度量分析

国家自然科学基金

1+阅读 · 2009年12月31日

On Scheduling Mechanisms Beyond the Worst Case

Arxiv

0+阅读 · 2022年4月20日

Is Non-IID Data a Threat in Federated Online Learning to Rank?

Arxiv

0+阅读 · 2022年4月20日

How Do Smart Contracts Benefit Security Protocols?

Arxiv

0+阅读 · 2022年4月20日

How to design a network architecture using capacity planning

Arxiv

0+阅读 · 2022年4月20日

Transfer Learning for Electricity Price Forecasting

Arxiv

3+阅读 · 2022年4月18日

Efficient Attribute Unlearning: Towards Selective Removal of Input Attributes from Feature Representations

Arxiv

0+阅读 · 2022年4月16日

Resource-Aware Distributed Submodular Maximization: A Paradigm for Multi-Robot Decision-Making

Resource-Aware Distributed Submodular Maximization: A Paradigm for Multi-Robot Decision-Making

Arxiv

0+阅读 · 2022年4月15日

Quantum Computing -- from NISQ to PISQ

Quantum Computing -- from NISQ to PISQ

Arxiv

1+阅读 · 2022年4月15日

Generalizing to Unseen Domains: A Survey on Domain Generalization

Arxiv

30+阅读 · 2021年3月10日

Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

Arxiv

14+阅读 · 2018年3月14日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

文档质量评估

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关VIP内容

机器学习中原型学习研究进展

机器学习中原型学习研究进展

专知会员服务

47+阅读 · 2022年1月18日

【AAAI 2022】使用点反馈与标准离线黑箱算法的在线影响力最大化问题

【AAAI 2022】使用点反馈与标准离线黑箱算法的在线影响力最大化问题

专知会员服务

14+阅读 · 2022年1月16日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知会员服务

30+阅读 · 2021年12月3日

面向任务型的对话系统研究进展

面向任务型的对话系统研究进展

专知会员服务

59+阅读 · 2021年11月17日

【ICML2021】基于数据采样的影响力最大化问题

专知会员服务

21+阅读 · 2021年8月1日

ACL2021 | 探讨跨句事件联合抽取问题

专知会员服务

21+阅读 · 2021年7月19日

【博士论文】搜索引擎中的实体推荐关键技术研究

【博士论文】搜索引擎中的实体推荐关键技术研究

专知会员服务

45+阅读 · 2020年12月9日

个性化推荐系统技术进展

个性化推荐系统技术进展

专知会员服务

66+阅读 · 2020年8月15日

基于知识图谱的推荐系统研究综述

基于知识图谱的推荐系统研究综述

专知会员服务

332+阅读 · 2020年8月10日

【机器学习课程】机器学习中的常识性问题

【机器学习课程】机器学习中的常识性问题

专知会员服务

75+阅读 · 2019年12月2日

相关资讯

机器学习中原型学习研究进展

机器学习中原型学习研究进展

专知

0+阅读 · 2022年1月18日

【AAAI 2022】使用点反馈与标准离线黑箱算法的在线影响力最大化问题

【AAAI 2022】使用点反馈与标准离线黑箱算法的在线影响力最大化问题

专知

0+阅读 · 2022年1月16日

【博士论文】大数据相似查询关键技术研究

【博士论文】大数据相似查询关键技术研究

专知

0+阅读 · 2021年12月2日

知识驱动的推荐系统：现状与展望

知识驱动的推荐系统：现状与展望

专知

1+阅读 · 2021年11月22日

机器学习中的数据级联

机器学习中的数据级联

TensorFlow

0+阅读 · 2021年7月15日

事实抽取与验证研究综述

事实抽取与验证研究综述

专知

0+阅读 · 2021年4月20日

文本情感分析方法研究综述

文本情感分析方法研究综述

专知

4+阅读 · 2021年4月20日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

机器学习研究会

12+阅读 · 2017年11月3日

从浅层模型到深度模型：概览机器学习优化算法

从浅层模型到深度模型：概览机器学习优化算法

机器之心

27+阅读 · 2017年7月9日

相关基金

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向异构物联网的安全融合理论及关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

混沌压缩感知关键基础理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于网络知识和人工知识的图像语义建模方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

维、哈、柯跨语言内容过滤关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

多核学习若干关键问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

多媒体问答中的若干关键问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

结构化机器学习若干关键问题研究

国家自然科学基金

1+阅读 · 2009年12月31日

偏好学习的若干关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于机器学习的软件度量分析

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

On Scheduling Mechanisms Beyond the Worst Case

Arxiv

0+阅读 · 2022年4月20日

Is Non-IID Data a Threat in Federated Online Learning to Rank?

Arxiv

0+阅读 · 2022年4月20日

How Do Smart Contracts Benefit Security Protocols?

Arxiv

0+阅读 · 2022年4月20日

How to design a network architecture using capacity planning

Arxiv

0+阅读 · 2022年4月20日

Transfer Learning for Electricity Price Forecasting

Arxiv

3+阅读 · 2022年4月18日

Efficient Attribute Unlearning: Towards Selective Removal of Input Attributes from Feature Representations

Arxiv

0+阅读 · 2022年4月16日

Resource-Aware Distributed Submodular Maximization: A Paradigm for Multi-Robot Decision-Making

Resource-Aware Distributed Submodular Maximization: A Paradigm for Multi-Robot Decision-Making

Arxiv

0+阅读 · 2022年4月15日

Quantum Computing -- from NISQ to PISQ

Quantum Computing -- from NISQ to PISQ

Arxiv

1+阅读 · 2022年4月15日

Generalizing to Unseen Domains: A Survey on Domain Generalization

Arxiv

30+阅读 · 2021年3月10日

Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

Arxiv

14+阅读 · 2018年3月14日

微信扫码咨询专知VIP会员