基于多样化查询的多标记主动学习研究 - 专知基金

会员服务 ·

0

机器学习 · 多标记学习 · 主动学习 · 半监督学习 ·

2015 年 12 月 31 日

基于多样化查询的多标记主动学习研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于多样化查询的多标记主动学习研究

项目编号： No.61503182

项目类型： 青年科学基金项目

立项/批准年度： 2016

项目学科： 其他

项目作者： 黄圣君

作者单位： 南京航空航天大学

项目金额： 22万元

中文摘要： 多标记学习是机器学习中的一个重要研究方向，其学习对象同时与多个标记相关联，人工标注大量样本将导致高昂代价。主动学习通过选择性地向用户查询部分最有价值的监督信息，可有效减少用户标注代价。现有方法往往采用单一的查询方式向用户询问一个样本的所有标记，效率较低，且无法满足模型在学习过程中随监督信息增加而不断变化的需求。本项目针对这一问题进行研究，主要内容包括：（1）提出基于“示例-标记”对相关性查询的多标记主动学习方法；（2）提出基于标记间相关度排序查询的多标记主动学习方法；（3）分析多标记主动学习中各阶段模型对监督信息的需求变化，并构建其理论基础；（4）设计自适应融合多种查询方式的多标记主动学习方法。本项目为进一步提高多标记主动学习效果开辟了新的思路和方向，成果有望在国内外重要学术期刊和会议上发表高质量论文4-6篇，并申请专利1-2项。

中文关键词： 机器学习；多标记学习；主动学习；半监督学习

英文摘要： Multi-label learning is an important research area of machine learning, where each object is simultaneously associated with multiple labels. Manually annotating a large set of multi-label objects will lead to high cost. Active learning, which selectively queries the most important supervision information from the oracle, can reduce the labeling cost significantly. Most existing methods query all labels of one instance at a time. Such a simple strategy is less effective, and cannot meet the varying requirements of the learning model on the supervision information. This project proposes to study on this important issue, and the research contents include: 1) proposing a multi-label active learning (MLAL) approach by querying the relevance on instance-label pairs; 2) proposing a MLAL approach by querying the relevance ordering of label pairs; 3) analyzing the varying requirements of the learning model and building the theoretical basic for it; 4) designing a MLAL approach to adaptively incorporate different query types. Our project provides a novel direction to further improve the performance of MLAL. It is expected to publish 4-6 papers on high quality journals or conferences and apply 1-2 patents.

英文关键词： machine learning;multi-label learning;active learning;semi-supervised learning

成为VIP会员查看完整内容

0

相关内容

机器学习

“机器学习是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与统计推断学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。很多推论问题属于无程序可循难度，所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知会员服务

49+阅读 · 2021年12月4日

【NeurIPS2021】SOLQ：基于学习查询的物体分割

【NeurIPS2021】SOLQ：基于学习查询的物体分割

专知会员服务

10+阅读 · 2021年11月9日

IEEE TPAMI | 基于标注偏差估计的实例相关PU学习

IEEE TPAMI | 基于标注偏差估计的实例相关PU学习

专知会员服务

12+阅读 · 2021年10月23日

【博士论文】基于深度学习的联合实体关系抽取

专知会员服务

91+阅读 · 2021年9月4日

【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

专知会员服务

35+阅读 · 2021年4月8日

基于机器学习的数据库技术综述

基于机器学习的数据库技术综述

专知会员服务

55+阅读 · 2021年1月2日

面向大数据领域的事理认知图谱构建与推断分析

面向大数据领域的事理认知图谱构建与推断分析

专知会员服务

104+阅读 · 2020年8月11日

克服小样本学习中灾难性遗忘方法研究

专知会员服务

51+阅读 · 2020年7月16日

【CCL 2019】2019信息检索趋势，山东大学教授任昭春博士

【CCL 2019】2019信息检索趋势，山东大学教授任昭春博士

专知会员服务

30+阅读 · 2019年11月12日

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

专知会员服务

39+阅读 · 2019年11月8日

子图检索增强的知识图谱问答方法 | 论文荐读

子图检索增强的知识图谱问答方法 | 论文荐读

学术头条

6+阅读 · 2022年3月30日

一文归纳AI数据增强之法

一文归纳AI数据增强之法

极市平台

2+阅读 · 2022年1月11日

主动学习（Active Learning）概述及最新研究

主动学习（Active Learning）概述及最新研究

PaperWeekly

2+阅读 · 2022年1月6日

东南大学提出条件自监督小样本学习方法，显著提升小样本分类准确率

东南大学提出条件自监督小样本学习方法，显著提升小样本分类准确率

PaperWeekly

4+阅读 · 2021年12月14日

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知

7+阅读 · 2021年12月4日

直播 | 复旦大学许燚：少量标注样本场景下基于数据编程的半监督分类

直播 | 复旦大学许燚：少量标注样本场景下基于数据编程的半监督分类

PaperWeekly

0+阅读 · 2021年11月29日

推荐只需要精确？顶会论文看多样化推荐研究趋势

推荐只需要精确？顶会论文看多样化推荐研究趋势

PaperWeekly

0+阅读 · 2021年11月28日

EMNLP2021 | 东北大学提出：一种基于全局特征的新型表填充关系三元组抽取模型

EMNLP2021 | 东北大学提出：一种基于全局特征的新型表填充关系三元组抽取模型

AI科技评论

1+阅读 · 2021年10月14日

面向大数据领域的事理认知图谱构建与推断分析

面向大数据领域的事理认知图谱构建与推断分析

专知

21+阅读 · 2020年8月11日

解读自监督学习(Self-Supervised Learning)几篇相关paper

解读自监督学习(Self-Supervised Learning)几篇相关paper

CVer

25+阅读 · 2020年2月21日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

弱标注下基于主动学习的检测器适应问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

缺失和不一致数据环境下描述逻辑查询回答的高效方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多模卫星移动终端的多路协作分集技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

半监督文本聚类算法在个性化文本分析上的研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于社会标记精化的多标记学习算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

支持分层细粒度分面检索的分面分类树构建方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于主动学习的半监督领域本体自动构建

国家自然科学基金

4+阅读 · 2009年12月31日

基于机器学习的软件度量分析

国家自然科学基金

1+阅读 · 2009年12月31日

BLISS: Robust Sequence-to-Sequence Learning via Self-Supervised Input Representation

Arxiv

0+阅读 · 2022年4月16日

FedVQCS: Federated Learning via Vector Quantized Compressed Sensing

Arxiv

0+阅读 · 2022年4月16日

It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection

Arxiv

0+阅读 · 2022年4月15日

Sources of Irreproducibility in Machine Learning: A Review

Arxiv

0+阅读 · 2022年4月15日

CAiD: Context-Aware Instance Discrimination for Self-supervised Learning in Medical Imaging

CAiD: Context-Aware Instance Discrimination for Self-supervised Learning in Medical Imaging

Arxiv

0+阅读 · 2022年4月15日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

Challenges of Artificial Intelligence -- From Machine Learning and Computer Vision to Emotional Intelligence

Arxiv

19+阅读 · 2022年1月5日

A Survey of Knowledge Enhanced Pre-trained Models

Arxiv

28+阅读 · 2021年10月1日

Pre-training Text Representations as Meta Learning

Arxiv

13+阅读 · 2020年4月12日

Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning

Arxiv

21+阅读 · 2018年12月25日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

多标记学习

半监督学习

热门VIP内容

开通专知VIP会员享更多权益服务

量化环境源与海洋学预报在反潜战决策中的价值 | 77页

【博士论文】用于概率程序与生成模型的变分推断

海底战已至：美国构思海底安全战略 | 最新报告

联邦API网关：将新端点快速集成到预定义模式中 | 最新53页

相关VIP内容

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知会员服务

49+阅读 · 2021年12月4日

【NeurIPS2021】SOLQ：基于学习查询的物体分割

【NeurIPS2021】SOLQ：基于学习查询的物体分割

专知会员服务

10+阅读 · 2021年11月9日

IEEE TPAMI | 基于标注偏差估计的实例相关PU学习

IEEE TPAMI | 基于标注偏差估计的实例相关PU学习

专知会员服务

12+阅读 · 2021年10月23日

【博士论文】基于深度学习的联合实体关系抽取

专知会员服务

91+阅读 · 2021年9月4日

【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

专知会员服务

35+阅读 · 2021年4月8日

基于机器学习的数据库技术综述

基于机器学习的数据库技术综述

专知会员服务

55+阅读 · 2021年1月2日

面向大数据领域的事理认知图谱构建与推断分析

面向大数据领域的事理认知图谱构建与推断分析

专知会员服务

104+阅读 · 2020年8月11日

克服小样本学习中灾难性遗忘方法研究

专知会员服务

51+阅读 · 2020年7月16日

【CCL 2019】2019信息检索趋势，山东大学教授任昭春博士

【CCL 2019】2019信息检索趋势，山东大学教授任昭春博士

专知会员服务

30+阅读 · 2019年11月12日

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

专知会员服务

39+阅读 · 2019年11月8日

相关资讯

子图检索增强的知识图谱问答方法 | 论文荐读

子图检索增强的知识图谱问答方法 | 论文荐读

学术头条

6+阅读 · 2022年3月30日

一文归纳AI数据增强之法

一文归纳AI数据增强之法

极市平台

2+阅读 · 2022年1月11日

主动学习（Active Learning）概述及最新研究

主动学习（Active Learning）概述及最新研究

PaperWeekly

2+阅读 · 2022年1月6日

东南大学提出条件自监督小样本学习方法，显著提升小样本分类准确率

东南大学提出条件自监督小样本学习方法，显著提升小样本分类准确率

PaperWeekly

4+阅读 · 2021年12月14日

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知

7+阅读 · 2021年12月4日

直播 | 复旦大学许燚：少量标注样本场景下基于数据编程的半监督分类

直播 | 复旦大学许燚：少量标注样本场景下基于数据编程的半监督分类

PaperWeekly

0+阅读 · 2021年11月29日

推荐只需要精确？顶会论文看多样化推荐研究趋势

推荐只需要精确？顶会论文看多样化推荐研究趋势

PaperWeekly

0+阅读 · 2021年11月28日

EMNLP2021 | 东北大学提出：一种基于全局特征的新型表填充关系三元组抽取模型

EMNLP2021 | 东北大学提出：一种基于全局特征的新型表填充关系三元组抽取模型

AI科技评论

1+阅读 · 2021年10月14日

面向大数据领域的事理认知图谱构建与推断分析

面向大数据领域的事理认知图谱构建与推断分析

专知

21+阅读 · 2020年8月11日

解读自监督学习(Self-Supervised Learning)几篇相关paper

解读自监督学习(Self-Supervised Learning)几篇相关paper

CVer

25+阅读 · 2020年2月21日

相关基金

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

弱标注下基于主动学习的检测器适应问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

缺失和不一致数据环境下描述逻辑查询回答的高效方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多模卫星移动终端的多路协作分集技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

半监督文本聚类算法在个性化文本分析上的研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于社会标记精化的多标记学习算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

支持分层细粒度分面检索的分面分类树构建方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于主动学习的半监督领域本体自动构建

国家自然科学基金

4+阅读 · 2009年12月31日

基于机器学习的软件度量分析

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

BLISS: Robust Sequence-to-Sequence Learning via Self-Supervised Input Representation

Arxiv

0+阅读 · 2022年4月16日

FedVQCS: Federated Learning via Vector Quantized Compressed Sensing

Arxiv

0+阅读 · 2022年4月16日

It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection

Arxiv

0+阅读 · 2022年4月15日

Sources of Irreproducibility in Machine Learning: A Review

Arxiv

0+阅读 · 2022年4月15日

CAiD: Context-Aware Instance Discrimination for Self-supervised Learning in Medical Imaging

CAiD: Context-Aware Instance Discrimination for Self-supervised Learning in Medical Imaging

Arxiv

0+阅读 · 2022年4月15日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

Challenges of Artificial Intelligence -- From Machine Learning and Computer Vision to Emotional Intelligence

Arxiv

19+阅读 · 2022年1月5日

A Survey of Knowledge Enhanced Pre-trained Models

Arxiv

28+阅读 · 2021年10月1日

Pre-training Text Representations as Meta Learning

Arxiv

13+阅读 · 2020年4月12日

Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning

Arxiv

21+阅读 · 2018年12月25日

微信扫码咨询专知VIP会员