题目: Learning from Evolving Streams via Self-Training Windowing Ensembles
摘要: 从数据流自适应学习的一个主要问题是类标签到达或丢失。假设正确的labelleddata总是可用的,并且是及时的,这通常是不可行的,因此,有监督的方法通常不直接适用于许多现实世界的问题。在这种情况下,必须使用半监督或无监督的学习技术。此外,流中概念漂移的检测也不应依赖于标签信息。在这两个观察的基础上,我们引入了我们的LESS-TWE框架,该框架将选择性自我训练与无监督的概念漂移检测器结合起来。我们基于集成的方法使用混合滑动窗口并使用所有预测,而不是只关注高预测可信度。我们的新窗口技术利用窗口对每一个分类器进行密集的训练,但是延迟训练的方式使得每一个循环迭代只能有一个分类器更新其模型。实验结果表明,我们的框架比目前最先进的技术要快(大约160倍),并且可以达到可比的预测精度。
作者简介:
Herna L Viktor,博士,加拿大渥太华大学电气工程与计算机科学学院计算机科学教授。研究方向:机器学习基础和算法、数据驱动发现和大数据应用。 个人主页:https://www.site.uottawa.ca/~hlviktor/。等