项目名称: 面向大规模RDF数据的分布式处理技术研究
项目编号: No.60903010
项目类型: 青年科学基金项目
立项/批准年度: 2010
项目学科: 金属学与金属工艺
项目作者: 吴刚
作者单位: 东南大学
项目金额: 17万元
中文摘要: 语义Web作为数据之网不断汇集并组织Web信息,相关应用因此面临着对语义Web所含大规模RDF数据高效访问的挑战。利用分布式处理技术提高性能是一种解决之道,其核心是RDF数据的放置策略、分布式查询处理与优化。已有工作尚未系统研究RDF数据放置策略的分类与特点,及其对分布式查询处理与优化的影响。本课题将首先分析RDF数据上各类数据放置策略及其影响。然后拟通过混合水平与垂直划分的方法实现分布式查询负载平衡与通信开销降低,并充分利用查询操作内与操作间两种并行性实现查询执行性能的提高。具体拟提出基于RDF模式子图频繁度来混合划分RDF图的数据放置策略;提出基于RDF图索引匹配的查询分解与分布式查询处理方法;相应提出基于代价分析的查询优化方法。研究成果将应用于一个已有的语义Web搜索引擎,改进存储与检索效率,验证方法的可行性和有效性。课题开展对推动语义Web、数据管理和分布式技术的发展具有重要意义。
中文关键词: 语义Web;RDF;数据管理;分布式;并行
英文摘要:
英文关键词: semantic Web;RDF;data management;distributed;parallel