项目名称: 基于协同训练策略的不完全标记数据流分类问题研究

项目编号: No.61273292

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 胡学钢

作者单位: 合肥工业大学

项目金额: 80万元

中文摘要: 现实世界数据流中类标签大量缺失的现象,使得基于示例是有标签假设的数据流分类算法难以适用。而数据流的海量、快速等特点,又使得传统的不完全标记数据处理方法面临挑战。因此,研究数据流中不完全标记数据处理的有效算法成为关键任务。本课题拟开展不完全标记数据流在线半监督学习方法研究,重点研究基于协同训练策略的在线半监督学习方法。首先在设计大纲数据提取数据流机制的基础上,研究协同训练策略的适应性理论与基于协同训练策略的类传播机制,构建鲁棒性在线半监督学习模型,并设计模型的泛化能力等评估标准。其次,为使所建的模型适应数据分布特征不断变化的特点,研究不完全标记数据流环境下的数据分布变化的检测与预测方法,探索无标签示例和噪音对数据分布变化影响的定性与定量关系,构建相应的度量标准与评价体系。基于上述研究,以网络产品评价内容分类为例,设计并实现面向Web服务应用领域的不完全标记数据流分类的原型系统。

中文关键词: 无标签数据;分类;概念漂移;数据流;

英文摘要: Most existing work on classification of data streams assumes that all arrived streaming data are labeled and the class labels are immediately available. However, in real-world applications, this assumption seems invalid. Thus, it is a challenge to learn from concept drifting data streams with unlabeled data. Meanwhile, when performing classification on data streams, traditional techniques for unlabeled data and labeled data have a relatively poor efficiency in both time and space due to the characteristics of data streams. Thus, it is significant to develop more efficient algorithms in the handling of data streams with unlabeled data. In our proposal, we focus on the study of online semi-supervised learning methods for data streams with unlabeled data, especially on study of online methods with co-training. More specifically, we first design new summarization techniques for data streams with unlabeled data, and then analyze the adaptation of co-training technique in data streams. Correspondingly, we focus on the research of labeling propagation methods in co-training, and aim to design the effectively and efficiently online semi-supervised learning methods and the corresponding evaluation measures. Secondly, we focus on the detection and prediction of the changing of data distributions using the above semi-super

英文关键词: Unlabeled data;Classification;Concept drifting;Data stream;

成为VIP会员查看完整内容
3

相关内容

基于深度神经网络的图像缺损修复方法综述
专知会员服务
25+阅读 · 2021年12月18日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
【NeurIPS2021】由相似性迁移的弱样本细粒度分类
专知会员服务
20+阅读 · 2021年11月11日
重邮高新波等最新《少样本目标检测算法》综述论文
专知会员服务
33+阅读 · 2021年11月2日
专知会员服务
16+阅读 · 2021年7月31日
专知会员服务
29+阅读 · 2020年9月18日
基于深度学习的多标签生成研究进展
专知会员服务
142+阅读 · 2020年4月25日
如何解决工业缺陷检测小样本问题?
极市平台
6+阅读 · 2022年2月24日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
基于深度学习的流行度预测研究综述
专知
0+阅读 · 2021年3月24日
已删除
德先生
53+阅读 · 2019年4月28日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
半监督深度学习小结:类协同训练和一致性正则化
【推荐】伪标签学习导论 - 一种半监督学习方法
机器学习研究会
12+阅读 · 2017年10月5日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
13+阅读 · 2022年1月20日
Arxiv
31+阅读 · 2021年3月29日
Attentive Graph Neural Networks for Few-Shot Learning
Arxiv
40+阅读 · 2020年7月14日
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
26+阅读 · 2020年3月13日
AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning
Arxiv
45+阅读 · 2019年12月20日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
小贴士
相关VIP内容
基于深度神经网络的图像缺损修复方法综述
专知会员服务
25+阅读 · 2021年12月18日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
【NeurIPS2021】由相似性迁移的弱样本细粒度分类
专知会员服务
20+阅读 · 2021年11月11日
重邮高新波等最新《少样本目标检测算法》综述论文
专知会员服务
33+阅读 · 2021年11月2日
专知会员服务
16+阅读 · 2021年7月31日
专知会员服务
29+阅读 · 2020年9月18日
基于深度学习的多标签生成研究进展
专知会员服务
142+阅读 · 2020年4月25日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Arxiv
13+阅读 · 2022年1月20日
Arxiv
31+阅读 · 2021年3月29日
Attentive Graph Neural Networks for Few-Shot Learning
Arxiv
40+阅读 · 2020年7月14日
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
26+阅读 · 2020年3月13日
AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning
Arxiv
45+阅读 · 2019年12月20日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
微信扫码咨询专知VIP会员