项目名称: 基于数据空间的海量数据处理方法与关键技术

项目编号: No.61272185

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 王念滨

作者单位: 哈尔滨工程大学

项目金额: 82万元

中文摘要: 海量数据处理在科学探索、环境保护、网络应用、商业智能、生物计算等领域有着广泛的研究价值和应用前景。海量数据处理是围绕数据展开的,其核心问题是数据的组织管理与分析方法。与传统的数据处理方法比较,目前海量数据具有的大容量、多格式特征对数据管理方法和数据处理能力提出了新的挑战。本项目研究以构建高效、可靠的大规模数据处理平台为目标,重点研究在无共享群集环境中大容量、多格式数据组织管理,高性能数据查询处理等关键技术。研究数据空间环境下海量数据的组织管理方法,提出多格式数据的组织管理模型,集成结构化、非结构化、半结构化数据,构建统一数据组织模型;研究数据空间环境下的高效索引策略,探讨数据空间环境下的海量数据负载均衡策略以提高系统的性能;研究数据空间环境下的语义缓存技术,提高系统响应能力。研究成果将为海量数据处理提供良好的理论基础,具有广阔的应用前景和重要的理论研究价值。

中文关键词: 数据空间;数据模型;索引;查询;

英文摘要: Large-scale data processing has a wide range of research value and application prospect in many fields,such as scientific exploration, environmental protection, network applications, business intelligence, bio-technology, and so on. In the massive data processing, data is its cornerstone and the core issue is the organization management and analysis methods of data. Compared with traditional data processing, massive data has large-capacity and multi-format characteristics, so it is faced with new challenges for us to manage and deal with data. In this project research, our target is to build an efficient and reliable large-scale data processing platform. Then we mainly study and discuss massive data processing from four aspects in detail. To begin with, we focus on the research of some key technologies in the no-shared cluster environment, such as high-performance data processing, large-capacity, multi-format data organization and management; Second, we investigate the massive data organization and management methods in the data space environment, present a model for organizing and managing multi-format data , integrate the structured, unstructured, semi-structured data, build a unified data organizational model; Third, we study an efficient indexing strategy in the data space environment, explore a massive d

英文关键词: Data Space;Data Model;Index;Query;

成为VIP会员查看完整内容
0

相关内容

军事知识图谱构建技术
专知会员服务
115+阅读 · 2022年4月8日
空间数据智能:概念、技术与挑战
专知会员服务
81+阅读 · 2022年2月3日
超级自动化技术与应用研究报告(2022年)
专知会员服务
77+阅读 · 2022年2月3日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
专知会员服务
17+阅读 · 2021年5月16日
专知会员服务
34+阅读 · 2021年5月10日
专知会员服务
32+阅读 · 2021年4月18日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
115+阅读 · 2020年5月10日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
LinkedIn数据分析技术栈的演进之路
AI前线
0+阅读 · 2022年2月19日
空间数据智能:概念、技术与挑战
专知
7+阅读 · 2022年2月4日
【北大】知识图谱的关键技术及其智能应用
专知
111+阅读 · 2019年9月19日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
36+阅读 · 2019年4月18日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Age Optimal Sampling Under Unknown Delay Statistics
Arxiv
0+阅读 · 2022年4月20日
SkiQL: A Unified Schema Query Language
Arxiv
0+阅读 · 2022年4月19日
A Sheaf-Theoretic Construction of Shape Space
Arxiv
0+阅读 · 2022年4月19日
Arxiv
135+阅读 · 2018年10月8日
小贴士
相关主题
相关VIP内容
军事知识图谱构建技术
专知会员服务
115+阅读 · 2022年4月8日
空间数据智能:概念、技术与挑战
专知会员服务
81+阅读 · 2022年2月3日
超级自动化技术与应用研究报告(2022年)
专知会员服务
77+阅读 · 2022年2月3日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
专知会员服务
17+阅读 · 2021年5月16日
专知会员服务
34+阅读 · 2021年5月10日
专知会员服务
32+阅读 · 2021年4月18日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
115+阅读 · 2020年5月10日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
相关资讯
LinkedIn数据分析技术栈的演进之路
AI前线
0+阅读 · 2022年2月19日
空间数据智能:概念、技术与挑战
专知
7+阅读 · 2022年2月4日
【北大】知识图谱的关键技术及其智能应用
专知
111+阅读 · 2019年9月19日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
36+阅读 · 2019年4月18日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员