基于分布式计算框架的大图数据描述性查询关键技术研究 - 专知基金

会员服务 ·

0

图查询处理 · 分布式框架 · 描述性查询 · 模式查询 ·

2012 年 12 月 31 日

基于分布式计算框架的大图数据描述性查询关键技术研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于分布式计算框架的大图数据描述性查询关键技术研究

项目编号： No.61272156

项目类型： 面上项目

立项/批准年度： 2013

项目学科： 自动化技术、计算机技术

项目作者： 高军

作者单位： 北京大学

项目金额： 82万元

中文摘要： 大图数据及其上应用为数据管理技术带来了巨大的挑战和机遇。利用现有相对成熟的MapReduce分布式计算框架管理大图数据是现实可行的技术方案。本课题针对现有框架下大图数据查询性能难以满足应用需求、用户编写图数据处理脚本繁琐低效等问题，围绕MapReduce框架下大图数据描述性查询，从理论方法与关键技术、原型系统两个层面展开研究工作。在理论方法与关键技术层面，本课题拟提出基于递归Datalog的描述性图查询语言，简化最终用户编写图操作脚本的代价；拟提出基于MapReduce框架的描述性图查询执行计划的构建方法，设计基于代价模型的优化和动态绑定策略；拟提出MapReduce框架中面向循环不变量的缓存策略，设计面向负载平衡的任务自适应分配机制，扩展分布式计算框架对大图数据管理的支持。在原型系统层面，本课题基于分布式计算框架MapReduce的开源系统Hadoop研制大图数据描述性查询的原型系统。

中文关键词： 图查询处理；分布式框架；描述性查询；模式查询；

英文摘要： Big graphs and their applications raise enormous challenges and opportunities to database researchers. It is a practical solution to exploit the existing MapReduce framework in managing big graphs to achieve a high scalability. In order to improve the performance of graph query in the MapReduce framework, and lessen the burdens of end uses in coding and debugging distributed programs, this project plans to study the key techniques of declarative query on big graphs using MapReduce framework. Specifically, this project will design a declarative graph query language based on recursive Datalog to ease the burdens of end users, propose a method to construct query evaluation plans using MapReduce, and devise query optimization and dynamic binding strategies based on a cost model. In addition, this project will study the extensions to the underlying MapReduce framework, including the global caching mechanism for iterative invariance in MapReduce job, and adaptive partitioning strategy for load balance in the reduce side. In addition, this project will build a prototype for the declarative graph query language based on Hadoop system, which is an open source implementation of MapReduce framework.

英文关键词： Graph Processing；Distributed Framework；Declarative Query；Pattern query；

成为VIP会员查看完整内容

0

相关内容

图查询处理

图查询处理

军事知识图谱构建技术

军事知识图谱构建技术

专知会员服务

134+阅读 · 2022年4月8日

中国金融科技产业联盟《金融分布式数字身份技术研究报告》98页pdf

中国金融科技产业联盟《金融分布式数字身份技术研究报告》98页pdf

专知会员服务

21+阅读 · 2022年3月23日

面向端边云协同架构的区块链技术综述

面向端边云协同架构的区块链技术综述

专知会员服务

49+阅读 · 2021年12月24日

【博士论文】大数据相似查询关键技术研究

【博士论文】大数据相似查询关键技术研究

专知会员服务

24+阅读 · 2021年12月2日

基于深度学习的图异常检测技术综述

基于深度学习的图异常检测技术综述

专知会员服务

86+阅读 · 2021年7月28日

【博士论文】搜索引擎中的实体推荐关键技术研究

【博士论文】搜索引擎中的实体推荐关键技术研究

专知会员服务

45+阅读 · 2020年12月9日

【VLDB2020】构建高吞吐量许可的区块链结构:挑战和机遇，190页ppt

【VLDB2020】构建高吞吐量许可的区块链结构:挑战和机遇，190页ppt

专知会员服务

16+阅读 · 2020年9月25日

大规模时间序列分析框架的研究与实现，计算机学报

大规模时间序列分析框架的研究与实现，计算机学报

专知会员服务

59+阅读 · 2020年7月13日

【实用书】Python数据分析与可视化，390页pdf，分析数据以创建BI系统的可视化

【实用书】Python数据分析与可视化，390页pdf，分析数据以创建BI系统的可视化

专知会员服务

163+阅读 · 2020年4月13日

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

专知会员服务

32+阅读 · 2019年11月8日

PolarDB 并行查询的前世今生

PolarDB 并行查询的前世今生

阿里技术

0+阅读 · 2022年2月17日

技术揭秘：实时数仓Hologres如何支持超大规模部署与运维

技术揭秘：实时数仓Hologres如何支持超大规模部署与运维

阿里技术

0+阅读 · 2022年2月9日

「大规模图神经网络系统」2022最新综述：从算法到系统

「大规模图神经网络系统」2022最新综述：从算法到系统

极市平台

5+阅读 · 2022年1月18日

CIKM21 | 图模型在广告检索（Ad Retrieval）中的应用

CIKM21 | 图模型在广告检索（Ad Retrieval）中的应用

图与推荐

0+阅读 · 2021年12月16日

【博士论文】大数据相似查询关键技术研究

【博士论文】大数据相似查询关键技术研究

专知

0+阅读 · 2021年12月2日

复杂推理模型从服务器移植到Web浏览器的理论和实战

复杂推理模型从服务器移植到Web浏览器的理论和实战

阿里技术

0+阅读 · 2021年9月29日

表格存储 SQL 查询多元索引

表格存储 SQL 查询多元索引

阿里技术

0+阅读 · 2021年9月8日

阿里多语言翻译模型的前沿探索及技术实践

阿里多语言翻译模型的前沿探索及技术实践

专知

1+阅读 · 2021年4月8日

图神经网络如何落地推荐系统？基于分布式图学习的推荐系统优化之路，带你实战

图神经网络如何落地推荐系统？基于分布式图学习的推荐系统优化之路，带你实战

专知

0+阅读 · 2021年3月15日

【Flink】基于 Flink 的流式数据实时去重

【Flink】基于 Flink 的流式数据实时去重

AINLP

14+阅读 · 2020年9月29日

基于事前约束的XML关键字查询处理技术

国家自然科学基金

0+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

基于频繁更新的大图数据查询和管理技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

分布式不确定数据查询处理关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

云环境下大规模动态图数据查询处理与优化技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

分布式环境下不确定数据查询处理与分析技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于近似关键字的大规模空间数据查询与处理

国家自然科学基金

0+阅读 · 2012年12月31日

云计算环境下基于BSP模型的大规模图数据查询处理技术

国家自然科学基金

0+阅读 · 2012年12月31日

可扩展的高效XML数据管理关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

面向大规模RDF数据的分布式处理技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

Insights into the Core of the Assignment Game via Complementarity

Insights into the Core of the Assignment Game via Complementarity

Arxiv

0+阅读 · 2022年4月20日

Counting and enumerating optimum cut sets for hypergraph $k$-partitioning problems for fixed $k$

Arxiv

0+阅读 · 2022年4月20日

Small Promise CSPs that reduce to large CSPs

Arxiv

0+阅读 · 2022年4月19日

A Sheaf-Theoretic Construction of Shape Space

A Sheaf-Theoretic Construction of Shape Space

Arxiv

0+阅读 · 2022年4月19日

The 2020 Census Disclosure Avoidance System TopDown Algorithm

Arxiv

0+阅读 · 2022年4月19日

Cellular Automata and Bootstrap Percolation

Arxiv

0+阅读 · 2022年4月19日

Coalgebras for Bisimulation of Weighted Automata over Semirings

Arxiv

0+阅读 · 2022年4月18日

A Survey on Efficient Processing of Similarity Queries over Neural Embeddings

Arxiv

1+阅读 · 2022年4月17日

Analytical Benchmark Problems for Multifidelity Optimization Methods

Arxiv

0+阅读 · 2022年4月16日

A general framework for identification of permissible variable subsets and development of structured variable selection methods

Arxiv

0+阅读 · 2022年4月14日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

图查询处理

分布式框架

描述性查询

热门VIP内容

开通专知VIP会员享更多权益服务

面向具身智能的多模态数据存储与检索：综述

《算法战争研究计划全景评估》35页

【CMU博士论文】水下三维视觉感知与生成

智能体战争：自主人工智能军备竞赛全景透视

相关VIP内容

军事知识图谱构建技术

军事知识图谱构建技术

专知会员服务

134+阅读 · 2022年4月8日

中国金融科技产业联盟《金融分布式数字身份技术研究报告》98页pdf

中国金融科技产业联盟《金融分布式数字身份技术研究报告》98页pdf

专知会员服务

21+阅读 · 2022年3月23日

面向端边云协同架构的区块链技术综述

面向端边云协同架构的区块链技术综述

专知会员服务

49+阅读 · 2021年12月24日

【博士论文】大数据相似查询关键技术研究

【博士论文】大数据相似查询关键技术研究

专知会员服务

24+阅读 · 2021年12月2日

基于深度学习的图异常检测技术综述

基于深度学习的图异常检测技术综述

专知会员服务

86+阅读 · 2021年7月28日

【博士论文】搜索引擎中的实体推荐关键技术研究

【博士论文】搜索引擎中的实体推荐关键技术研究

专知会员服务

45+阅读 · 2020年12月9日

【VLDB2020】构建高吞吐量许可的区块链结构:挑战和机遇，190页ppt

【VLDB2020】构建高吞吐量许可的区块链结构:挑战和机遇，190页ppt

专知会员服务

16+阅读 · 2020年9月25日

大规模时间序列分析框架的研究与实现，计算机学报

大规模时间序列分析框架的研究与实现，计算机学报

专知会员服务

59+阅读 · 2020年7月13日

【实用书】Python数据分析与可视化，390页pdf，分析数据以创建BI系统的可视化

【实用书】Python数据分析与可视化，390页pdf，分析数据以创建BI系统的可视化

专知会员服务

163+阅读 · 2020年4月13日

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

专知会员服务

32+阅读 · 2019年11月8日

相关资讯

PolarDB 并行查询的前世今生

PolarDB 并行查询的前世今生

阿里技术

0+阅读 · 2022年2月17日

技术揭秘：实时数仓Hologres如何支持超大规模部署与运维

技术揭秘：实时数仓Hologres如何支持超大规模部署与运维

阿里技术

0+阅读 · 2022年2月9日

「大规模图神经网络系统」2022最新综述：从算法到系统

「大规模图神经网络系统」2022最新综述：从算法到系统

极市平台

5+阅读 · 2022年1月18日

CIKM21 | 图模型在广告检索（Ad Retrieval）中的应用

CIKM21 | 图模型在广告检索（Ad Retrieval）中的应用

图与推荐

0+阅读 · 2021年12月16日

【博士论文】大数据相似查询关键技术研究

【博士论文】大数据相似查询关键技术研究

专知

0+阅读 · 2021年12月2日

复杂推理模型从服务器移植到Web浏览器的理论和实战

复杂推理模型从服务器移植到Web浏览器的理论和实战

阿里技术

0+阅读 · 2021年9月29日

表格存储 SQL 查询多元索引

表格存储 SQL 查询多元索引

阿里技术

0+阅读 · 2021年9月8日

阿里多语言翻译模型的前沿探索及技术实践

阿里多语言翻译模型的前沿探索及技术实践

专知

1+阅读 · 2021年4月8日

图神经网络如何落地推荐系统？基于分布式图学习的推荐系统优化之路，带你实战

图神经网络如何落地推荐系统？基于分布式图学习的推荐系统优化之路，带你实战

专知

0+阅读 · 2021年3月15日

【Flink】基于 Flink 的流式数据实时去重

【Flink】基于 Flink 的流式数据实时去重

AINLP

14+阅读 · 2020年9月29日

相关基金

基于事前约束的XML关键字查询处理技术

国家自然科学基金

0+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

基于频繁更新的大图数据查询和管理技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

分布式不确定数据查询处理关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

云环境下大规模动态图数据查询处理与优化技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

分布式环境下不确定数据查询处理与分析技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于近似关键字的大规模空间数据查询与处理

国家自然科学基金

0+阅读 · 2012年12月31日

云计算环境下基于BSP模型的大规模图数据查询处理技术

国家自然科学基金

0+阅读 · 2012年12月31日

可扩展的高效XML数据管理关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

面向大规模RDF数据的分布式处理技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Insights into the Core of the Assignment Game via Complementarity

Insights into the Core of the Assignment Game via Complementarity

Arxiv

0+阅读 · 2022年4月20日

Counting and enumerating optimum cut sets for hypergraph $k$-partitioning problems for fixed $k$

Arxiv

0+阅读 · 2022年4月20日

Small Promise CSPs that reduce to large CSPs

Arxiv

0+阅读 · 2022年4月19日

A Sheaf-Theoretic Construction of Shape Space

A Sheaf-Theoretic Construction of Shape Space

Arxiv

0+阅读 · 2022年4月19日

The 2020 Census Disclosure Avoidance System TopDown Algorithm

Arxiv

0+阅读 · 2022年4月19日

Cellular Automata and Bootstrap Percolation

Arxiv

0+阅读 · 2022年4月19日

Coalgebras for Bisimulation of Weighted Automata over Semirings

Arxiv

0+阅读 · 2022年4月18日

A Survey on Efficient Processing of Similarity Queries over Neural Embeddings

Arxiv

1+阅读 · 2022年4月17日

Analytical Benchmark Problems for Multifidelity Optimization Methods

Arxiv

0+阅读 · 2022年4月16日

A general framework for identification of permissible variable subsets and development of structured variable selection methods

Arxiv

0+阅读 · 2022年4月14日

微信扫码咨询专知VIP会员