项目名称: 大数据高效能存储与管理方法研究

项目编号: No.U1435216

项目类型: 联合基金项目

立项/批准年度: 2015

项目学科: 自动化技术、计算机技术

项目作者: 武永卫

作者单位: 清华大学

项目金额: 105万元

中文摘要: 随着数据规模的爆炸式增长和数据模式的高度复杂化,世界已进入网络化的大数据时代。大数据的多样化与持续快速增长、用户对大数据处理与存储的多种类需求等都对大数据的存储与管理提出了新挑战。本项目开展大数据高效能存储与管理方法研究,提出针对大数据应用I/O特征定制的按需构建机制和可自调整运行优化方法,支持多个大数据组织与管理模式的同时运行机制,实现多层次存储介质硬件部件的整体利用率和单位时间内大数据处理条目数两方面的综合效能提升。项目从大数据高效能存储与管理体系、支撑技术和应用验证三个方面,解决应用定制存储系统的按需定制与动态调整、应用存储特性灵敏感知与自回馈机制、高并发多种类复杂数据存储的效能管理、数据动态聚散机制、存算传融合的存储调度、多应用定制存储系统共存的系统效能评测方法等问题,最后通过卫星遥感大数据流式数据管理和分析、海洋环境监测大数据统计分析等开展应用验证。

中文关键词: 大数据;存储系统;高效能;按需定制;动态自调整

英文摘要: With the explosive growth of data size and data complexity, it is no doubt that we are stepping into the Big Data era. However, the diversity and continued increment of both data and users' requirements put forward new challenges on the existing data storage and management systems. In order to achieve high efficiency in terms of both hardware utilization at different levels and the number of data.items processed per unit time, this project aims to develop a set of Big Data storage and management technologies, including the way to construct I/O-specific (application customizable) storage systems on-demand, the method to implement dynamic self-tuning of the constructed system, and the mechanism to simultaneously run multiple big data organization and management models on a pool of various.devices. More specifically, the project focuses on three aspects of high-efficient big data storage and management (i.e., architecture, supporting techniques and application verification) and tries to solve such problems as how to construct an application customizable storage system on demand and to tune it dynamically, how to efficiently sense and classify I/O behavior of applications and automatically feed the result back to the storage management system, how to effectively and efficiently manage the storage of various high-concurrent complex data, how to gather and scatter data, how to schedule storage tasks in a storage-compute-transfer-aware way, and how to evaluate a storage system that allows for the simultaneous run of multiple application customizable storage systems. Finally, a system will be developed and evaluated with real data from satellite remote sensing and ocean monitoring.

英文关键词: Big Data;Storage System;High Efficiency;On-demand Customization ;Dynamic Self-tuning

成为VIP会员查看完整内容
2

相关内容

从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
专知会员服务
52+阅读 · 2021年10月1日
专知会员服务
74+阅读 · 2021年7月24日
专知会员服务
43+阅读 · 2021年6月30日
2021工业互联网大数据白皮书(附下载)
专知会员服务
80+阅读 · 2021年4月30日
专知会员服务
295+阅读 · 2021年4月8日
《人工智能计算中心白皮书》,43页pdf
专知会员服务
152+阅读 · 2021年3月5日
空间数据智能:概念、技术与挑战
专知
8+阅读 · 2022年2月4日
MYSQL深潜 - 剖析Performance Schema内存管理
阿里技术
0+阅读 · 2021年9月23日
云上应用系统数据存储架构演进
阿里技术
2+阅读 · 2021年9月1日
2021工业互联网大数据白皮书(附下载)
专知
8+阅读 · 2021年4月30日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
136+阅读 · 2018年10月8日
小贴士
相关VIP内容
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
专知会员服务
52+阅读 · 2021年10月1日
专知会员服务
74+阅读 · 2021年7月24日
专知会员服务
43+阅读 · 2021年6月30日
2021工业互联网大数据白皮书(附下载)
专知会员服务
80+阅读 · 2021年4月30日
专知会员服务
295+阅读 · 2021年4月8日
《人工智能计算中心白皮书》,43页pdf
专知会员服务
152+阅读 · 2021年3月5日
相关资讯
空间数据智能:概念、技术与挑战
专知
8+阅读 · 2022年2月4日
MYSQL深潜 - 剖析Performance Schema内存管理
阿里技术
0+阅读 · 2021年9月23日
云上应用系统数据存储架构演进
阿里技术
2+阅读 · 2021年9月1日
2021工业互联网大数据白皮书(附下载)
专知
8+阅读 · 2021年4月30日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员