项目名称: 集群环境下基于内存的高性能数据管理与分析

项目编号: No.61332006

项目类型: 重点项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 周傲英

作者单位: 华东师范大学

项目金额: 300万元

中文摘要: 随着市场竞争的加剧和企业信息化程度的提高,传统商务智能系统难以满足当前决策时效性的要求,实时商务智能已成为许多企业追求的目标,硬件和体系结构的发展为之提供了技术条件。本项目旨在研究集群环境下基于内存的高性能数据管理与分析技术,探索符合应用需求、充分发挥硬件效能的决策类大数据处理技术,为实现实时商务智能奠定基础。重点研究:1)非一致访问内存环境下的数据高效存储,包括列式密集存储、内存感知布局和压缩感知处理;2)大规模异构计算资源的充分利用,包括函数至核有向无环工作流式和处理器结合迭代式并行处理,以及会话调度策略和计算优先负载平衡;3)内存系统可靠性保障,包括基于世系的内存数据集容错、热备进程的任务快速恢复等;4)针对特定应用的基本算子和执行计划优化。本项目的研究符合现实应用需求和技术发展趋势,具有广阔的应用前景和学术价值。申请人在数据管理方面积累充分,研究方案可行,能保证本项目顺利完成。

中文关键词: 数据管理;内存数据容错;大规模并行处理;非一致内存访问;商务智能

英文摘要: With the increasing intension of market competition and the continuously development of enterprise informatization, it is hard for the conventional business intelligence systems to meet the requirements about the timely decision. The real-time business intelligence is then becoming a goal which more and more enterprises are pursuing. The great advance on computer hardware and architecture offers technical background for the real-time business intelligence. The project mainly will focus on the high performance data management and analytics based on in-memory cluster computing, which is expected to set a solid foundation for the efficient processing of the decision-making big data, taking full advantage of the progress on hardware, and taking the real life application into consideration. The major research topics are as followings. 1) High performance data storage with non-uniform access memory, including column-oriented dense packing storage, memory-sensitive data placement, and compression-aware data processing. 2) Fully using the heterogeneous computation resources, including DAG workflow parallel processing based on function-at-a-core strategy, interactive parallel processing based on processor-affined scheduling, session scheduling strategy, and load balance based on computation priority. 3) High availability of the building systems, such as fault-tolerant data set based on lineage, task recovery based on standby process. 4) The optimization on primary operators and execution plan for the specific applications, to achieve the ad hoc human real-time interactive analysis. The planned research conforms to the current applications and the development of the related technologies. It is of broad interests to the participants from academic and industries. The applicants have profound technical accumulation on the related areas, and have explored preliminarily on the proposed research plan, which ensure this project to be accomplished successfully.

英文关键词: In-memory computing;fault-tolerant for memory data;parallel processing;NUMA;business intellegence

成为VIP会员查看完整内容
0

相关内容

数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。其目的在于充分有效地发挥数据的作用。实现数据有效管理的关键是数据组织。
计算体系架构研究综述与思考
专知会员服务
65+阅读 · 2022年3月21日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
34+阅读 · 2022年3月21日
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
专知会员服务
33+阅读 · 2021年7月29日
专知会员服务
62+阅读 · 2021年5月2日
【耶鲁】数据结构与编程技术,656页pdf
专知会员服务
55+阅读 · 2021年4月26日
【耶鲁】数据结构与编程技术,572页pdf
专知会员服务
46+阅读 · 2020年12月27日
专知会员服务
15+阅读 · 2020年11月8日
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
如何降低云计算基础设施的复杂度?
InfoQ
0+阅读 · 2022年1月4日
流计算引擎数据一致性的本质
阿里技术
0+阅读 · 2021年10月13日
云上应用系统数据存储架构演进
阿里技术
2+阅读 · 2021年9月1日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
1+阅读 · 2022年4月19日
Arxiv
35+阅读 · 2022年3月14日
小贴士
相关VIP内容
计算体系架构研究综述与思考
专知会员服务
65+阅读 · 2022年3月21日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
34+阅读 · 2022年3月21日
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
专知会员服务
33+阅读 · 2021年7月29日
专知会员服务
62+阅读 · 2021年5月2日
【耶鲁】数据结构与编程技术,656页pdf
专知会员服务
55+阅读 · 2021年4月26日
【耶鲁】数据结构与编程技术,572页pdf
专知会员服务
46+阅读 · 2020年12月27日
专知会员服务
15+阅读 · 2020年11月8日
相关资讯
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
如何降低云计算基础设施的复杂度?
InfoQ
0+阅读 · 2022年1月4日
流计算引擎数据一致性的本质
阿里技术
0+阅读 · 2021年10月13日
云上应用系统数据存储架构演进
阿里技术
2+阅读 · 2021年9月1日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员