项目名称: 基于高斯过程模型的多示例多标记学习算法研究

项目编号: No.61503058

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 其他

项目作者: 贺建军

作者单位: 大连民族大学

项目金额: 22万元

中文摘要: 多示例多标记学习是近年来提出的一种处理多义性数据的新机器学习框架,由于它为挖掘样本与其类别标记间的驱动关系提供了可行性,正受到越来越多的关注。高斯过程模型是一种核方法,具有易实现、可自适应地挖掘关系信息等优点。本项目旨在基于高斯过程模型建立一种面向大规模未完全标注多义性数据的多示例多标记学习算法,拟先通过设计一种新结构的高斯过程模型,解决同时挖掘示例与标记间关系和标记与标记间关系这两种重要信息的问题;然后基于随机变分推理法建立一种复杂度较低的模型求解方法,解决处理大规模训练数据的问题;最后借助PU学习技术的思想建立一种两阶段策略,解决有效利用未完全标注数据的问题,从而达到最终目的。本项目利用高斯过程模型不仅解决了同时挖掘示例与标记间关系和标记与标记间关系这个算法构建的核心问题,还解决了核方法复杂度过高不宜处理大规模数据的问题,可有效推动多示例多标记学习技术在大数据中的应用。

中文关键词: 弱标记学习;多示例学习;多标记学习

英文摘要: Multi-instance multi-label learning is a machine learning framework proposed recently for solving the problem of multi-semantic data. Because it can provide a possibility for explaining why a concerned sample has the certain class labels, multi-instance multi-label learning framework is attracting more and more attention. Gaussian process model is a kernel method that has many merits such as being implemented easily, adaptively discovering the relationship among variables. This project aims at developing a novel multi-instance multi-label learning algorithm based on Gaussian process model for solving the problem of large-scale incompletely annotated multi-semantic data. It includes research to solve the problem of simultaneously describing the relationship between instances and labels as well as the relationship among labels by designing a new Gaussian process model, to solve the large-scale training data problem by proposing an solving approach with lower computational cost for Gaussian process model based on stochastic variational inference, to solve the incompletely annotated data problem by developing a two-step strategy based on ideas of positive and unlabeled learning. Based on Gaussian process model, we not only develop a model that can simultaneously describe the relationship between instances and labels as well as the relationship among labels, which is a key problem for developing multi-instance multi-label learning algorithm, but also solve the problem that kernel methods is difficult to process large-scale training data. This project will promote the application of multi-instance multi-label learning in big data.

英文关键词: Weak label learning;Multi-instance learning;Multi-label learning

成为VIP会员查看完整内容
10

相关内容

【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
【NeurIPS2021】由相似性迁移的弱样本细粒度分类
专知会员服务
20+阅读 · 2021年11月11日
专知会员服务
87+阅读 · 2021年9月4日
【经典书】半监督学习,524页pdf
专知会员服务
134+阅读 · 2021年8月20日
专知会员服务
28+阅读 · 2021年6月7日
专知会员服务
77+阅读 · 2020年12月6日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
229+阅读 · 2020年5月2日
基于深度学习的多标签生成研究进展
专知会员服务
142+阅读 · 2020年4月25日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
解读 | 得见的高斯过程
机器学习算法与Python学习
14+阅读 · 2019年2月13日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
范式大学|迁移学习实战:从算法到实践
机器学习研究会
16+阅读 · 2017年8月9日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
2+阅读 · 2022年4月20日
Detecting Deepfakes with Self-Blended Images
Arxiv
2+阅读 · 2022年4月18日
Arxiv
13+阅读 · 2021年5月3日
小贴士
相关VIP内容
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
【NeurIPS2021】由相似性迁移的弱样本细粒度分类
专知会员服务
20+阅读 · 2021年11月11日
专知会员服务
87+阅读 · 2021年9月4日
【经典书】半监督学习,524页pdf
专知会员服务
134+阅读 · 2021年8月20日
专知会员服务
28+阅读 · 2021年6月7日
专知会员服务
77+阅读 · 2020年12月6日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
229+阅读 · 2020年5月2日
基于深度学习的多标签生成研究进展
专知会员服务
142+阅读 · 2020年4月25日
相关资讯
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
解读 | 得见的高斯过程
机器学习算法与Python学习
14+阅读 · 2019年2月13日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
范式大学|迁移学习实战:从算法到实践
机器学习研究会
16+阅读 · 2017年8月9日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员