项目名称: 数据流上面向可伸缩模式的查询方法研究
项目编号: No.61170003
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 李红燕
作者单位: 北京大学
项目金额: 57万元
中文摘要: 诸如医疗等实际应用领域更关注数据流上连续的数据区段而并非单个数据点,如何灵活地在数据流上表达基于模式的查询请求并完成查询处理,就成为一个重要和现实的问题。本课题深入分析了典型应用领域内数据流模式查询的需求和特征,提出了可伸缩模式查询的概念,支持用户在查询目标内设置重复、缺失和倒置语义,通过提取查询目标中相对不变、可相互区分的稳定因素来形成基模式,通过基模式组合来得到复杂目标模式,以"不变(有限基模式集合)"应"万变(基模式的各种组合出现)",既保证了可伸缩模式丰富的查询语义,又实现了查询表达的确定性和简洁性。进而通过在连续数据段和基模式这两种不同表达形式之间的比对把数据流实时转换成基模式流,通过查询重写在可伸缩模式查询网络上执行查询处理和优化,并保证在大数据量爆发和高噪声环境下查询的有效性。最终为用户提供一种灵活的、语义丰富的、通用的可伸缩模式查询方式。同时研制基于理论研究成果的原型系统。
中文关键词: 数据流;模式;可伸缩性;查询;
英文摘要:
英文关键词: Data Stream;Pattern;Scalability;Query;