项目名称: 基于概要结构的数据流历史数据的组织与分析
项目编号: No.60973047
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 陈华辉
作者单位: 宁波大学
项目金额: 30万元
中文摘要: 动态构造能近似表示数据流的概要结构是数据流处理的核心。目前数据流研究多假设应用中用户主要关心最近时间段内数据流上的数据,因而构造概要时一般采用界标模型、滑动窗口模型或数据衰减模型等三种模型,对较远过去的流历史数据,要么完全放弃,要么被衰减成影响很小。但分析实际的数据流应用可以发现,有许多应用会关心数据流历史数据。本项目通过保存数据流历史窗口的概要,进而提供历史概要组织和管理的有效手段,从而实现数据流历史数据的有效分析和处理。主要研究: (1)概要的归并; (2)概要的分层组织; (3)概要的索引结构; (4)分布式环境中的数据流概要的索引和组织; (5)利用概要的分层组织和索引结构,提供对数据流历史数据的各类分析,包括OLAP分析、相似性分析、相关性分析、kNN查询、聚类分析、趋势分析、频繁项分析和聚集查询等。
中文关键词: 数据流;概要结构;索引结构;近似表示;分层组织
英文摘要:
英文关键词: Data stream;Synopses;Index;Approximate representation;Hierarchical Data