项目名称: 基于数据共享的高并发图计算系统及核心技术研究

项目编号: No.61472009

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 自动化技术、计算机技术

项目作者: 代亚非

作者单位: 北京大学

项目金额: 80万元

中文摘要: 图数据是大数据的重要数据类型之一,图处理技术是当前的研究热点,出现了以Pregel, Giraph,GraphLab,GraphX等为代表的图处理的系统。这些系统大多基于面向任务的处理模式:将图计算分解成一个个相互独立的任务来完成,每个任务中计算程序和数据紧密耦合。这样的模式在并发度不高的情况下,收到了预期的效果。但是,随着应用的不断扩展,要求并发处理的任务越来越多,数据和计算绑定的模式则遇到性能瓶颈。由于面向任务的模式,不支持共享数据,每个任务都需导入各自所需的数据,往往造成冗余数据占据内存,消耗巨大,并发执行的任务极其有限,严重阻碍了图处理系统性能的提升。 本申请提出一种新型的面向数据的图计算模式,以支持图数据共享为基础,目的是有效使用内存,支持高并发的任务执行,从而从整体上提高图计算的效率。本项目将对支持高并发图计算系统的图数据管理、流式计算模型、执行机制和技术展开详细研究。

中文关键词: 并行计算;图计算;大数据处理;并发控制;数据共享

英文摘要: Graph data is one of the typical type of the big data and graph computing has become a research hotspot in present. There have been many graph computing systems which are represented by Pregel, Giraph,GraphLab,GraphX and so on. The processing mode adopted by these systems is task oriented, in which,a graph computing procedure is divided into a series individual tasks in which the processing procedure and data are tightly coupled together. Such mode woks well with lower concurrency. However with the various applications continue to expand, more and more tasks need to be processed concurrently. In this case the coupling of procedure and data become the bottle neck for efficiency. Because the task oriented model does not support the data sharing, each task has to store their graph data in memory, which causes the redundant graph data exhausting the memory which extremely limits the concurrency of tasks processing, thereby heavily impede the improvement of performance of graph computing systems. In this proposal, we present a novel data oriented graph computing model which based on the data sharing technology to achieve efficient utilization of memory to support high concurrency task processing and to increase the whole efficiency of graph computing systems. Enclosing the aim, we will deeply study related the data manager method, stream computing model, execution mechanism and related core technologies.

英文关键词: parallel computing;grapgh computing;big data processing;concurrency control;data sharing

成为VIP会员查看完整内容
0

相关内容

「大规模图神经网络系统」最新2022综述:从算法到系统
专知会员服务
115+阅读 · 2022年1月14日
【博士论文】分形计算系统
专知会员服务
34+阅读 · 2021年12月9日
【博士论文】大数据相似查询关键技术研究
专知会员服务
24+阅读 · 2021年12月2日
面向大数据处理框架的JVM优化技术综述
专知会员服务
17+阅读 · 2021年11月27日
数据中心传感器技术应用 白皮书
专知会员服务
42+阅读 · 2021年11月13日
图计算加速架构综述
专知会员服务
50+阅读 · 2021年4月5日
最新《多任务学习》综述,39页pdf
专知会员服务
265+阅读 · 2020年7月10日
面向大数据处理框架的JVM优化技术综述
专知
0+阅读 · 2021年11月27日
云上应用系统数据存储架构演进
阿里技术
2+阅读 · 2021年9月1日
图计算加速架构综述
专知
0+阅读 · 2021年4月5日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
One-Class Model for Fabric Defect Detection
Arxiv
0+阅读 · 2022年4月20日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
11+阅读 · 2018年4月25日
小贴士
相关VIP内容
「大规模图神经网络系统」最新2022综述:从算法到系统
专知会员服务
115+阅读 · 2022年1月14日
【博士论文】分形计算系统
专知会员服务
34+阅读 · 2021年12月9日
【博士论文】大数据相似查询关键技术研究
专知会员服务
24+阅读 · 2021年12月2日
面向大数据处理框架的JVM优化技术综述
专知会员服务
17+阅读 · 2021年11月27日
数据中心传感器技术应用 白皮书
专知会员服务
42+阅读 · 2021年11月13日
图计算加速架构综述
专知会员服务
50+阅读 · 2021年4月5日
最新《多任务学习》综述,39页pdf
专知会员服务
265+阅读 · 2020年7月10日
相关资讯
面向大数据处理框架的JVM优化技术综述
专知
0+阅读 · 2021年11月27日
云上应用系统数据存储架构演进
阿里技术
2+阅读 · 2021年9月1日
图计算加速架构综述
专知
0+阅读 · 2021年4月5日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员