项目名称: 基于特征发现的数据流概念漂移问题研究
项目编号: No.60975034
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 胡学钢
作者单位: 合肥工业大学
项目金额: 32万元
中文摘要: 现实应用领域中的数据流概念漂移现象具有隐含、未知、易变以及多重性等特点,使已有的机制、模型与方法难以满足用户对精确度、时空性能等方面的要求。因此,如何快速有效地发现所隐含的概念漂移特征,设计鲁棒性模型和有效算法成为研究数据流中概念漂移问题的重要任务。本课题重点开展基于漂移特征发现的数据流概念漂移问题研究。通过深入分析数据流特点研究特定的概念形式化描述方法,探索概念漂移特征与隐式上下文中相关因素的定性或定量关系及其描述,寻求快速有效的漂移特征发现与预测方法,研究基于漂移特征的概念漂移检测算法和模型,构建适于数据流环境的概念漂移度量标准与评价体系。此外,为降低数据流中噪音与数据分布不平衡所导致的对概念漂移发现质量的影响,开展基于漂移特征的噪音建模、噪音检测、噪音过滤以及数据(类别)分布倾斜度调节策略与方法的研究。在上述工作基础上,设计并实现面向Web服务应用领域的概念漂移问题求解原型系统。
中文关键词: 数据流;分类;概念漂移;多源数据流;特征选择
英文摘要:
英文关键词: Data Stream;Classification;Concept Drift;Multi-source Data Stream;Feature Selection