项目名称: 云计算Hadoop框架中高效迭代机制的研究

项目编号: No.61201447

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 电子学与信息系统

项目作者: 朱颢东

作者单位: 郑州轻工业学院

项目金额: 24万元

中文摘要: 云计算Hadoop框架作为一种专门处理海量数据的新式计算模型,近年来受到极大关注并成为智能信息处理领域的研究热点。然而,前期研究表明,该模型在迭代操作方面性能较低,这在一定程度上限制了其应用能力。为此,本项目将着重研究云计算Hadoop框架中的迭代功能,设计新的迭代机制,使其能够有效支持迭代操作。首先,以增强云计算Hadoop框架的迭代操作性能为目的,在该框架的基础上设计一种新的云计算Hadoop框架;然后针对新框架,为其设计新的迭代控制模块以及新的应用程序接口,以使用户能方便地实现迭代操作;随后,在新框架中设计迭代可重用数据的缓存和检索模块,以减少从Master结点频繁重复下载这类数据带来的I/O操作并在使用时快速定位它们;最后,根据迭代的特点,设计相应的任务调度和容错方法。相关研究的进展和突破,必将会进一步丰富云计算Hadoop框架理论体系,为高效地处理海量数据提供一种更有效的手段。

中文关键词: 大数据;云计算;Hadoop 框架;迭代机制;

英文摘要: As a new special computation model for mass data processing, Hadoop framework for Cloud Computing has attracted great attention among domestic and abroad academic circles in recent years and become a research hotspot in intelligent information processing. However, the pre-project research results show that Hadoop framework can't effectively carry out iterative operation so that to some extent,its application ability is limited.This project will focus on the iteration function in Hadoop framework and design a new loop-iteration mechanism to efficiently support iterative operation.Firstly, we design a new Hadoop framework for Cloud Computing based on the old Hadoop framework in order to improve iterative operation performance.And then, according to the new framework we propose a new loop-iteration control module and an new application program interface to help users realize iterative operation more conveniently.Subsequently, we present the cache and index modules for iterative reusable data to reduce frequently load them from Master node and effectively index them form Slaver nodes. Lastly, we provide the corresponding task scheduling and fault-tolerant method according to the new loop-iteration mechanism.The progress and breakthrough of relevant researches in this project will further enrich the theoretical syste

英文关键词: Big Data;Cloud Computing;Hadoop Framework;Iterative Mechanism;

成为VIP会员查看完整内容
0

相关内容

从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。
图神经网络综述
专知会员服务
193+阅读 · 2022年1月9日
面向大数据处理框架的JVM优化技术综述
专知会员服务
16+阅读 · 2021年11月27日
专知会员服务
33+阅读 · 2021年10月17日
专知会员服务
22+阅读 · 2021年6月23日
大规模时间序列分析框架的研究与实现,计算机学报
专知会员服务
58+阅读 · 2020年7月13日
FPGA加速系统开发工具设计:综述与实践
专知会员服务
62+阅读 · 2020年6月24日
专知会员服务
78+阅读 · 2020年6月20日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
94+阅读 · 2019年12月4日
「图神经网络东」最新2022综述
专知
9+阅读 · 2022年1月9日
如何降低云计算基础设施的复杂度?
InfoQ
0+阅读 · 2022年1月4日
如何形成统一设计风格-实践篇
阿里技术
0+阅读 · 2021年12月7日
面向大数据处理框架的JVM优化技术综述
专知
0+阅读 · 2021年11月27日
Hadoop 生态里,为什么 Hive 活下来了?
InfoQ
0+阅读 · 2021年10月6日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月7日
Arxiv
12+阅读 · 2019年2月28日
小贴士
相关VIP内容
图神经网络综述
专知会员服务
193+阅读 · 2022年1月9日
面向大数据处理框架的JVM优化技术综述
专知会员服务
16+阅读 · 2021年11月27日
专知会员服务
33+阅读 · 2021年10月17日
专知会员服务
22+阅读 · 2021年6月23日
大规模时间序列分析框架的研究与实现,计算机学报
专知会员服务
58+阅读 · 2020年7月13日
FPGA加速系统开发工具设计:综述与实践
专知会员服务
62+阅读 · 2020年6月24日
专知会员服务
78+阅读 · 2020年6月20日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
94+阅读 · 2019年12月4日
相关资讯
「图神经网络东」最新2022综述
专知
9+阅读 · 2022年1月9日
如何降低云计算基础设施的复杂度?
InfoQ
0+阅读 · 2022年1月4日
如何形成统一设计风格-实践篇
阿里技术
0+阅读 · 2021年12月7日
面向大数据处理框架的JVM优化技术综述
专知
0+阅读 · 2021年11月27日
Hadoop 生态里,为什么 Hive 活下来了?
InfoQ
0+阅读 · 2021年10月6日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员