项目名称: 基于纠删码的大规模存储集群重构优化技术

项目编号: No.61300046

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 万胜刚

作者单位: 华中科技大学

项目金额: 26万元

中文摘要: 大规模存储集群是当前云存储与大数据存储系统的基础平台,所包含的成千上万软件与硬件部件随时都可能失效,从而导致服务中断甚至数据丢失等严重问题。传统基于多副本冗余技术在数据量增大时,其运营成本急剧上升,因此使用存储效率更高的纠删码技术成为必然,但传统纠删码具有较差的重构性能。针对这一问题,观察到集群内冗余存储单元、存储节点和网络上下链路使用情况和失效模式具有较强的非平衡性,因此本课题研究通过调度存储集群内的大量处理、传输与存储资源,通过优先恢复低可靠性条带的数据,适当延迟正常用户请求以加快降级读请求,及利用纠删码编码规则提高条带内重构的并行性,设计加快纠删码存储集群的数据重构过程的方法和机制,从而提高系统整体性能、可用性及可靠性。在保持可靠性的同时,有效降低云存储与大数据存储系统的冗余成本。

中文关键词: 存储集群;可靠性;性能;纠删码;固态盘

英文摘要: As the infrastructure of cloud storage and big data storage systems, storage clusters are widely deployed in data centers. Typically, a storage cluster is composed of thousands of independent nodes and contains a lots of commodity software and hardware components. In such an environment, failures are not rare. Those failures result in service interruption and data loss which may seize up the running of the whole society. Therefore, redundant schemes should be introduced to improve the availability and reliability of storage systems thus reduce the risk brought by failures. As a data redundant technology, erasure codes promise high availability and reliability at low cost. However, an erasure-coded storage cluster suffers from potential problems of performance, availability and reliability, which are incurred by the traditional centralized reconstruction approach. To address these problems, we propose a series of approaches to speed up the reconstruction process by leveraging the abundant process, transmission and storage resources in the storage clusters. Through these approaches, the performance, availability, and reliability of the systems can be improved. As a result, the redundant cost of cloud storage and big data storage can be reduced by deploying those practical erasure-coded storage clusters.

英文关键词: Storage Clusters;Reliability;Performance;Erasure Codes;SSD

成为VIP会员查看完整内容
0

相关内容

专知会员服务
23+阅读 · 2021年7月15日
2021年金融级数据库容灾技术报告(附PDF全文)
专知会员服务
20+阅读 · 2021年7月11日
专知会员服务
12+阅读 · 2021年6月20日
大规模时间序列分析框架的研究与实现,计算机学报
专知会员服务
59+阅读 · 2020年7月13日
如何提升 HBase 大规模集群下的低延时性能
AI前线
0+阅读 · 2022年3月28日
云计算成本优化终极指南
InfoQ
0+阅读 · 2022年2月12日
如何降低云计算基础设施的复杂度?
InfoQ
0+阅读 · 2022年1月4日
云上应用系统数据存储架构演进
阿里技术
2+阅读 · 2021年9月1日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Verified Compilation of Quantum Oracles
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月17日
小贴士
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员