在很多真实应用中,数据以流的形式不断被收集得到.由于数据收集环境往往发生动态变化,流数据的分布也会随时间不断变化.传统的机器学习技术依赖于数据独立同分布假设,因而在这类分布变化的流数据学习问题上难以奏效.本文提出一种基于决策树模型重用的算法进行分布变化的流数据学习.该算法是一种在线集成学习方法:算法将维护一个模型库,并通过决策树模型重用机制更新模型库.其核心思想是希望从历史数据中挖掘与当前学习相关的知识,从而抵御分布变化造成的影响.通过在合成数据集和真实数据集上进行实验,我们验证了本文提出方法的有效性.

https://engine.scichina.com/doi/10.1360/SSI-2020-0170

成为VIP会员查看完整内容
23

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
可信机器学习的公平性综述
专知会员服务
66+阅读 · 2021年2月23日
专知会员服务
32+阅读 · 2021年2月12日
专知会员服务
30+阅读 · 2021年2月7日
基于机器学习的数据库技术综述
专知会员服务
53+阅读 · 2021年1月2日
专知会员服务
23+阅读 · 2020年12月16日
专知会员服务
95+阅读 · 2020年12月8日
元自步学习
专知会员服务
33+阅读 · 2020年9月4日
基于统计关系学习的自动数据清洗
FCS
7+阅读 · 2019年3月1日
基于样本选择的安全图半监督学习方法
【学界】基于生成对抗网络的多视图学习与重构算法
GAN生成式对抗网络
6+阅读 · 2018年7月12日
机器学习汇总,珍藏版!
机器学习算法与Python学习
8+阅读 · 2018年3月5日
基于机器学习方法的POI品类推荐算法
全球人工智能
3+阅读 · 2017年11月22日
基于MOOC数据的学习行为分析与预测
计算机研究与发展
6+阅读 · 2017年10月11日
基于聚类和决策树的链路预测方法
计算机研究与发展
8+阅读 · 2017年8月25日
Arxiv
0+阅读 · 2021年3月23日
Arxiv
0+阅读 · 2021年3月22日
Arxiv
0+阅读 · 2021年3月21日
Arxiv
10+阅读 · 2020年4月5日
Arxiv
4+阅读 · 2019年12月2日
Arxiv
19+阅读 · 2018年5月17日
VIP会员
相关VIP内容
可信机器学习的公平性综述
专知会员服务
66+阅读 · 2021年2月23日
专知会员服务
32+阅读 · 2021年2月12日
专知会员服务
30+阅读 · 2021年2月7日
基于机器学习的数据库技术综述
专知会员服务
53+阅读 · 2021年1月2日
专知会员服务
23+阅读 · 2020年12月16日
专知会员服务
95+阅读 · 2020年12月8日
元自步学习
专知会员服务
33+阅读 · 2020年9月4日
相关资讯
基于统计关系学习的自动数据清洗
FCS
7+阅读 · 2019年3月1日
基于样本选择的安全图半监督学习方法
【学界】基于生成对抗网络的多视图学习与重构算法
GAN生成式对抗网络
6+阅读 · 2018年7月12日
机器学习汇总,珍藏版!
机器学习算法与Python学习
8+阅读 · 2018年3月5日
基于机器学习方法的POI品类推荐算法
全球人工智能
3+阅读 · 2017年11月22日
基于MOOC数据的学习行为分析与预测
计算机研究与发展
6+阅读 · 2017年10月11日
基于聚类和决策树的链路预测方法
计算机研究与发展
8+阅读 · 2017年8月25日
相关论文
微信扫码咨询专知VIP会员