The non-stationary nature of data streams strongly challenges traditional machine learning techniques. Although some solutions have been proposed to extend traditional machine learning techniques for handling data streams, these approaches either require an initial label set or rely on specialized design parameters. The overlap among classes and the labeling of data streams constitute other major challenges for classifying data streams. In this paper, we proposed a clustering-based data stream classification framework to handle non-stationary data streams without utilizing an initial label set. A density-based stream clustering procedure is used to capture novel concepts with a dynamic threshold and an effective active label querying strategy is introduced to continuously learn the new concepts from the data streams. The sub-cluster structure of each cluster is explored to handle the overlap among classes. Experimental results and quantitative comparison studies reveal that the proposed method provides statistically better or comparable performance than the existing methods.


翻译:数据流的非静止性质对传统的机器学习技术提出了强烈的挑战。虽然已经提出一些解决办法,以扩大处理数据流的传统机器学习技术,但这些办法要么需要初步的标签,要么依靠专门的设计参数。数据流的分类重叠和标签是数据流分类的其他重大挑战。在本文件中,我们提议了一个基于集群的数据流分类框架,以处理非静止数据流,而不用最初的标签集。一个基于密度的流群集程序用来捕捉具有动态阈值的新概念,并采用有效的积极标签查询战略,不断从数据流中学习新概念。每个组群的分组结构是用来处理分类重叠的。实验结果和定量比较研究表明,拟议的方法比现有方法在统计上更好或更具有可比性。

0
下载
关闭预览

相关内容

【Manning新书】现代Java实战,592页pdf
专知会员服务
101+阅读 · 2020年5月22日
【大规模数据系统,552页ppt】Large-scale Data Systems
专知会员服务
61+阅读 · 2019年12月21日
2019年机器学习框架回顾
专知会员服务
36+阅读 · 2019年10月11日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
Arxiv
0+阅读 · 2021年8月18日
Arxiv
31+阅读 · 2020年9月21日
Arxiv
3+阅读 · 2016年2月24日
VIP会员
相关VIP内容
【Manning新书】现代Java实战,592页pdf
专知会员服务
101+阅读 · 2020年5月22日
【大规模数据系统,552页ppt】Large-scale Data Systems
专知会员服务
61+阅读 · 2019年12月21日
2019年机器学习框架回顾
专知会员服务
36+阅读 · 2019年10月11日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
相关论文
Arxiv
0+阅读 · 2021年8月18日
Arxiv
31+阅读 · 2020年9月21日
Arxiv
3+阅读 · 2016年2月24日
Top
微信扫码咨询专知VIP会员