分布式数据流的集成模式挖掘模型和概念漂移检测算法研究 - 专知基金

会员服务 ·

1

分布式数据流 · 集成学习 · 概念漂移 · 全局分类 · 全局聚类 ·

2008 年 12 月 31 日

分布式数据流的集成模式挖掘模型和概念漂移检测算法研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 分布式数据流的集成模式挖掘模型和概念漂移检测算法研究

项目编号： No.60873145

项目类型： 面上项目

立项/批准年度： 2009

项目学科： 矿业工程

项目作者： 毛国君

作者单位： 北京工业大学

项目金额： 30万元

中文摘要： 许多应用具有典型的分布式数据流特征。和单数据流的模式挖掘相比，分布式数据流需要分布式的挖掘构架，由此带来的理论和方法上的问题需要解决。本项目研究了分布式数据流的形式化方法、分布式数据流的集成模式学习模型、节点级（单数据流）的局部模式更新算法、分布式数据流的全局模式挖掘模型与算法、面向于数据到达不均匀的分布式数据流的概念漂移挖掘算法等问题。利用密度网格、支持向量机以及微簇等先进技术，解决了分布式数据流的全局分类以及聚类等问题；利用数学和人工智能等手段，研究了分布式数据流的形式化表示及挖掘模型构造；利用统计学和已有的数据挖掘技术等，探索了分布式数据流的全局模式发现模型和算法构造等。实验说明：我们提出的方法能很好地适应分布式数据流模式挖掘的需要，有较高的精度或者效率。

中文关键词： 分布式数据流；集成学习；概念漂移；全局分类；全局聚类

英文摘要： There are many applications have typical features of distributed data streams. Comparing with a single data stream, a distributed data stream needs new mining frameworks to support in distributed ways, and it can result in many new problems in theory and methods. We have studied some important problems in mining distributed data streams, which involves expression formalization, ensemble learning, local model updating, global model mining and concept drifting in distributed data streams. Using density-grid, SVM and micro-cluster, we created some global classifying and clustering models; Making use of mathematics and artificial intelligence, we constructed distributed mining expression models; Studying statistics and data mining methods for distributed data streams, we designed some global models and algorithms for mining distributed data streams. Experimental results demonstrate that the proposed methods are able to help build mining models more accurate or efficient than other simple approaches can offer.

英文关键词： distributed data stream; ensemble learning; concept drifting; global classification; global clustering

成为VIP会员查看完整内容

2

相关内容

分布式数据流

分布式数据流

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

专知会员服务

34+阅读 · 2022年1月12日

【NeurIPS2021】基于关联与识别的少样本目标检测

【NeurIPS2021】基于关联与识别的少样本目标检测

专知会员服务

24+阅读 · 2021年11月29日

【ICML2021】基于安全聚合的分布式离散高斯联邦学习机制

专知会员服务

22+阅读 · 2021年9月6日

【KDD2021】图神经网络的自适应迁移学习

专知会员服务

66+阅读 · 2021年7月25日

【ICML2021】具有性能保证的弱监督下的对抗性多类学习

专知会员服务

17+阅读 · 2021年7月13日

【2021新书】Python流数据实用机器学习，127页pdf

【2021新书】Python流数据实用机器学习，127页pdf

专知会员服务

75+阅读 · 2021年5月23日

【经典书】数据挖掘和机器学习:基本概念和算法，附电子书与PPT

【经典书】数据挖掘和机器学习:基本概念和算法，附电子书与PPT

专知会员服务

169+阅读 · 2021年2月23日

基于决策树模型重用的分布变化流数据学习

专知会员服务

24+阅读 · 2021年1月30日

GCN如何并行化？分布式图卷积神经网路，13页pdf

GCN如何并行化？分布式图卷积神经网路，13页pdf

专知会员服务

35+阅读 · 2020年7月20日

【硬核书】可扩展机器学习：并行分布式方法

【硬核书】可扩展机器学习：并行分布式方法

专知会员服务

86+阅读 · 2020年5月23日

【经典书】高效机器学习，Efficient Learning Machines，263页pdf

【经典书】高效机器学习，Efficient Learning Machines，263页pdf

专知

3+阅读 · 2022年4月13日

基于机器学习的自动化网络流量分析

基于机器学习的自动化网络流量分析

CCF计算机安全专委会

5+阅读 · 2022年4月8日

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

专知

2+阅读 · 2022年1月12日

【NeurIPS2021】基于关联与识别的少样本目标检测

【NeurIPS2021】基于关联与识别的少样本目标检测

专知

0+阅读 · 2021年11月29日

NeurIPS 2021 | CyGen：基于概率论理论的生成式建模新模式

NeurIPS 2021 | CyGen：基于概率论理论的生成式建模新模式

微软研究院AI头条

0+阅读 · 2021年11月26日

【Flink】基于 Flink 的流式数据实时去重

【Flink】基于 Flink 的流式数据实时去重

AINLP

14+阅读 · 2020年9月29日

全新水下目标检测算法SWIPENet+IMA框架（已开源）

全新水下目标检测算法SWIPENet+IMA框架（已开源）

CVer

17+阅读 · 2020年5月31日

已删除

将门创投

12+阅读 · 2019年7月1日

干货：基于用户画像的聚类分析

干货：基于用户画像的聚类分析

数据分析

22+阅读 · 2018年5月17日

教你用Flink实现超大规模用户行为分析（附代码、视频教程）

教你用Flink实现超大规模用户行为分析（附代码、视频教程）

THU数据派

12+阅读 · 2017年9月29日

社交网络级联数据流异常检测模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

分布式环境下不确定数据查询处理与分析技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于数据分布评估和支持向量机方法的分布式数据流挖掘模型和算法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于无线传感器网络的随机场分布式估计算法

国家自然科学基金

0+阅读 · 2012年12月31日

基于分形与数据流挖掘技术的动态数据挖掘方法及其应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于Hadoop的分布式并行联机分析处理技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于特征发现的数据流概念漂移问题研究

国家自然科学基金

2+阅读 · 2009年12月31日

基于隐私保护的分布式数据流异常检测模型融合研究

国家自然科学基金

1+阅读 · 2009年12月31日

实时数据流中动态模式的发现与跟踪

国家自然科学基金

0+阅读 · 2009年12月31日

Dependent Optics

Arxiv

0+阅读 · 2022年4月20日

Deterministic Distributed algorithms and Descriptive Combinatorics on Δ-regular trees

Arxiv

0+阅读 · 2022年4月20日

Not All Tokens Are Equal: Human-centric Visual Analysis via Token Clustering Transformer

Arxiv

0+阅读 · 2022年4月19日

Efficient comparison of sentence embeddings

Arxiv

0+阅读 · 2022年4月18日

TranS: Transition-based Knowledge Graph Embedding with Synthetic Relation Representation

Arxiv

0+阅读 · 2022年4月18日

Distributed MST Computation in the Sleeping Model: Awake-Optimal Algorithms and Lower Bounds

Distributed MST Computation in the Sleeping Model: Awake-Optimal Algorithms and Lower Bounds

Arxiv

0+阅读 · 2022年4月18日

High-Dimensional Geometric Streaming in Polynomial Space

Arxiv

0+阅读 · 2022年4月18日

Transfer Learning under High-dimensional Generalized Linear Models

Arxiv

0+阅读 · 2022年4月17日

Generalized $b$-symbol weights of Linear Codes and $b$-symbol MDS Codes

Arxiv

0+阅读 · 2022年4月16日

Learning Latent Representations to Influence Multi-Agent Interaction

Arxiv

11+阅读 · 2020年11月12日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

分布式数据流

热门VIP内容

开通专知VIP会员享更多权益服务

人机协同时代的军事指挥控制演进

《英国智库：瓦解俄罗斯防空系统生产，夺回制空权》最新报告

《通过仿真与开源数据提升战略决策：机遇与局限》最新报告

《战术突击工具包：军队的“边缘”操作系统》报告

相关VIP内容

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

专知会员服务

34+阅读 · 2022年1月12日

【NeurIPS2021】基于关联与识别的少样本目标检测

【NeurIPS2021】基于关联与识别的少样本目标检测

专知会员服务

24+阅读 · 2021年11月29日

【ICML2021】基于安全聚合的分布式离散高斯联邦学习机制

专知会员服务

22+阅读 · 2021年9月6日

【KDD2021】图神经网络的自适应迁移学习

专知会员服务

66+阅读 · 2021年7月25日

【ICML2021】具有性能保证的弱监督下的对抗性多类学习

专知会员服务

17+阅读 · 2021年7月13日

【2021新书】Python流数据实用机器学习，127页pdf

【2021新书】Python流数据实用机器学习，127页pdf

专知会员服务

75+阅读 · 2021年5月23日

【经典书】数据挖掘和机器学习:基本概念和算法，附电子书与PPT

【经典书】数据挖掘和机器学习:基本概念和算法，附电子书与PPT

专知会员服务

169+阅读 · 2021年2月23日

基于决策树模型重用的分布变化流数据学习

专知会员服务

24+阅读 · 2021年1月30日

GCN如何并行化？分布式图卷积神经网路，13页pdf

GCN如何并行化？分布式图卷积神经网路，13页pdf

专知会员服务

35+阅读 · 2020年7月20日

【硬核书】可扩展机器学习：并行分布式方法

【硬核书】可扩展机器学习：并行分布式方法

专知会员服务

86+阅读 · 2020年5月23日

相关资讯

【经典书】高效机器学习，Efficient Learning Machines，263页pdf

【经典书】高效机器学习，Efficient Learning Machines，263页pdf

专知

3+阅读 · 2022年4月13日

基于机器学习的自动化网络流量分析

基于机器学习的自动化网络流量分析

CCF计算机安全专委会

5+阅读 · 2022年4月8日

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

专知

2+阅读 · 2022年1月12日

【NeurIPS2021】基于关联与识别的少样本目标检测

【NeurIPS2021】基于关联与识别的少样本目标检测

专知

0+阅读 · 2021年11月29日

NeurIPS 2021 | CyGen：基于概率论理论的生成式建模新模式

NeurIPS 2021 | CyGen：基于概率论理论的生成式建模新模式

微软研究院AI头条

0+阅读 · 2021年11月26日

【Flink】基于 Flink 的流式数据实时去重

【Flink】基于 Flink 的流式数据实时去重

AINLP

14+阅读 · 2020年9月29日

全新水下目标检测算法SWIPENet+IMA框架（已开源）

全新水下目标检测算法SWIPENet+IMA框架（已开源）

CVer

17+阅读 · 2020年5月31日

已删除

将门创投

12+阅读 · 2019年7月1日

干货：基于用户画像的聚类分析

干货：基于用户画像的聚类分析

数据分析

22+阅读 · 2018年5月17日

教你用Flink实现超大规模用户行为分析（附代码、视频教程）

教你用Flink实现超大规模用户行为分析（附代码、视频教程）

THU数据派

12+阅读 · 2017年9月29日

相关基金

社交网络级联数据流异常检测模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

分布式环境下不确定数据查询处理与分析技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于数据分布评估和支持向量机方法的分布式数据流挖掘模型和算法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于无线传感器网络的随机场分布式估计算法

国家自然科学基金

0+阅读 · 2012年12月31日

基于分形与数据流挖掘技术的动态数据挖掘方法及其应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于Hadoop的分布式并行联机分析处理技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于特征发现的数据流概念漂移问题研究

国家自然科学基金

2+阅读 · 2009年12月31日

基于隐私保护的分布式数据流异常检测模型融合研究

国家自然科学基金

1+阅读 · 2009年12月31日

实时数据流中动态模式的发现与跟踪

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Dependent Optics

Arxiv

0+阅读 · 2022年4月20日

Deterministic Distributed algorithms and Descriptive Combinatorics on Δ-regular trees

Arxiv

0+阅读 · 2022年4月20日

Not All Tokens Are Equal: Human-centric Visual Analysis via Token Clustering Transformer

Arxiv

0+阅读 · 2022年4月19日

Efficient comparison of sentence embeddings

Arxiv

0+阅读 · 2022年4月18日

TranS: Transition-based Knowledge Graph Embedding with Synthetic Relation Representation

Arxiv

0+阅读 · 2022年4月18日

Distributed MST Computation in the Sleeping Model: Awake-Optimal Algorithms and Lower Bounds

Distributed MST Computation in the Sleeping Model: Awake-Optimal Algorithms and Lower Bounds

Arxiv

0+阅读 · 2022年4月18日

High-Dimensional Geometric Streaming in Polynomial Space

Arxiv

0+阅读 · 2022年4月18日

Transfer Learning under High-dimensional Generalized Linear Models

Arxiv

0+阅读 · 2022年4月17日

Generalized $b$-symbol weights of Linear Codes and $b$-symbol MDS Codes

Arxiv

0+阅读 · 2022年4月16日

Learning Latent Representations to Influence Multi-Agent Interaction

Arxiv

11+阅读 · 2020年11月12日

微信扫码咨询专知VIP会员