项目名称: 基于图模型的海量非结构化数据查询语言及其优化实现
项目编号: No.61170086
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 钱卫宁
作者单位: 华东师范大学
项目金额: 57万元
中文摘要: 海量非结构化数据的管理是新型数据密集型应用中碰到的重要问题,图模型是对非结构数据进行建模的一种重要工具。本项目旨在针对Web数据管理、科学数据管理等应用对于海量非结构化数据管理的需求,系统研究基于图模型的非结构化数据查询语言的形式化定义和语义基础、灵活/可扩展的查询语言设计、针对集群环境的查询计划表示与代价模型,以及高效的适应性分布式查询优化算法。项目将针对应用中查询需求多样、数据量大、应用环境为大规模集群的特点,重点研究基于图模型的查询语言的形式化描述、环境相关的查询计划表示和代价模型,集群环境中无集中控制的分布式代价估计、代价维护和适应性查询处理和优化技术,并通过具有实际应用背景的原型系统验证所研究方法的有效性。项目的研究工作基于项目组成员多年来对于分布式和P2P系统中的查询处理、Web数据管理、集群环境中的数据存储与索引研究工作,是现有研究的自然延续。项目目标明确,可行性较强。
中文关键词: 非结构化数据;查询语言;查询优化;图模型数据;查询处理
英文摘要:
英文关键词: Unstructured data;query language;query optimization;graph model;query processing