项目名称: 基于分布式计算框架的大图数据描述性查询关键技术研究

项目编号: No.61272156

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 高军

作者单位: 北京大学

项目金额: 82万元

中文摘要: 大图数据及其上应用为数据管理技术带来了巨大的挑战和机遇。利用现有相对成熟的MapReduce分布式计算框架管理大图数据是现实可行的技术方案。本课题针对现有框架下大图数据查询性能难以满足应用需求、用户编写图数据处理脚本繁琐低效等问题,围绕MapReduce框架下大图数据描述性查询,从理论方法与关键技术、原型系统两个层面展开研究工作。在理论方法与关键技术层面,本课题拟提出基于递归Datalog的描述性图查询语言,简化最终用户编写图操作脚本的代价;拟提出基于MapReduce框架的描述性图查询执行计划的构建方法,设计基于代价模型的优化和动态绑定策略;拟提出MapReduce框架中面向循环不变量的缓存策略,设计面向负载平衡的任务自适应分配机制,扩展分布式计算框架对大图数据管理的支持。在原型系统层面,本课题基于分布式计算框架MapReduce的开源系统Hadoop研制大图数据描述性查询的原型系统。

中文关键词: 图查询处理;分布式框架;描述性查询;模式查询;

英文摘要: Big graphs and their applications raise enormous challenges and opportunities to database researchers. It is a practical solution to exploit the existing MapReduce framework in managing big graphs to achieve a high scalability. In order to improve the performance of graph query in the MapReduce framework, and lessen the burdens of end uses in coding and debugging distributed programs, this project plans to study the key techniques of declarative query on big graphs using MapReduce framework. Specifically, this project will design a declarative graph query language based on recursive Datalog to ease the burdens of end users, propose a method to construct query evaluation plans using MapReduce, and devise query optimization and dynamic binding strategies based on a cost model. In addition, this project will study the extensions to the underlying MapReduce framework, including the global caching mechanism for iterative invariance in MapReduce job, and adaptive partitioning strategy for load balance in the reduce side. In addition, this project will build a prototype for the declarative graph query language based on Hadoop system, which is an open source implementation of MapReduce framework.

英文关键词: Graph Processing;Distributed Framework;Declarative Query;Pattern query;

成为VIP会员查看完整内容
0

相关内容

军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
面向端边云协同架构的区块链技术综述
专知会员服务
48+阅读 · 2021年12月24日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
基于深度学习的图异常检测技术综述
专知会员服务
83+阅读 · 2021年7月28日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
大规模时间序列分析框架的研究与实现,计算机学报
专知会员服务
58+阅读 · 2020年7月13日
PolarDB 并行查询的前世今生
阿里技术
0+阅读 · 2022年2月17日
CIKM21 | 图模型在广告检索(Ad Retrieval)中的应用
图与推荐
0+阅读 · 2021年12月16日
表格存储 SQL 查询多元索引
阿里技术
0+阅读 · 2021年9月8日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
A Sheaf-Theoretic Construction of Shape Space
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月19日
小贴士
相关VIP内容
军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
面向端边云协同架构的区块链技术综述
专知会员服务
48+阅读 · 2021年12月24日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
基于深度学习的图异常检测技术综述
专知会员服务
83+阅读 · 2021年7月28日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
大规模时间序列分析框架的研究与实现,计算机学报
专知会员服务
58+阅读 · 2020年7月13日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员