项目名称: 混合云中的数据密集型工作流调度策略研究

项目编号: No.61300042

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 刘晓

作者单位: 华东师范大学

项目金额: 27万元

中文摘要: 随着大规模科学计算和面向海量用户的电子商务的发展,基于云计算的工作流系统需要处理大量数据密集型的应用。高效的工作流调度策略是保证工作流系统性能和用户满意度的关键。如何提高云计算环境中的工作流执行效率并降低处理海量数据所需的资源成本成为工作流调度的核心问题。本项目针对混合云的发展趋势及其带来的挑战,创新性的提出了一个扩展的云工作流调度策略,其核心是将数据密集型工作流的调度从传统的仅在工作流执行中扩展到工作流的整个生命周期,即包括工作流执行前的原始数据放置策略(其目标是降低原始数据的传输时间和成本),工作流执行中的中间数据和计算任务调度(其目标是灵活调度中间数据和计算任务来优化工作流执行的时间和成本),以及工作流执行结束后的中间数据删除(其目标是降低海量中间数据的存储成本)。项目研究成果能系统地解决混合云中数据密集型工作流的调度问题,降低工作流执行的时间和成本,从而有效地提高用户的满意度。

中文关键词: 云计算;工作流调度;数据密集型应用;混合云系统;

英文摘要: With the rapid growth of large scale scientific computing and mass-user oriented e-Business, cloud computing based workflow systems need to handle a large number of data-intensive applications. The key to guarantee the system performance and user's satisfaction is an effective workflow scheduling strategy, and its vital issue is how to promote the efficiency of workflow execution and reduce the cost for massive data processing. To cope with the trend of hybrid clouds and its challenges, this project proposes an extended cloud workflow scheduling strategy, i.e. a novel workflow scheduling framework for data-intensive applications in hybrid clouds. The core idea of this framework is to extend the traditional runtime workflow scheduling to the whole workflow lifecycle, specifically including the placement of source data before workflow runtime (with the aim of reducing the time overhead and cost for transferring source data), the scheduling of intermediate data and computing tasks at workflow runtime (with the aim of reducing the workflow running time and cost by smart scheduling of intermediate data and computing tasks), and the intermediate data reduction after workflow execution (with the aim of reducing the storage cost for massive intermediate data). The outcome of this project will systematically address the

英文关键词: Cloud Computing;Workflow Scheduling;Data-Intensive Applications;Hybrid Clouds;

成为VIP会员查看完整内容
1

相关内容

云计算(Cloud computing)是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。整个运行方式很像电网,类似之前的网格计算。
数据中心产业图谱研究报告,41页pdf
专知会员服务
53+阅读 · 2022年1月31日
视频隐私保护技术综述
专知会员服务
34+阅读 · 2022年1月19日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
专知会员服务
34+阅读 · 2021年10月17日
专知会员服务
79+阅读 · 2021年7月28日
专知会员服务
55+阅读 · 2021年6月9日
Spark & Hive 云原生改造在智领云的应用
CSDN
0+阅读 · 2022年4月8日
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
ADBPG&Greenplum成本优化之磁盘水位管理
阿里技术
0+阅读 · 2022年1月12日
如何降低云计算基础设施的复杂度?
InfoQ
0+阅读 · 2022年1月4日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
14+阅读 · 2021年3月10日
Arxiv
14+阅读 · 2019年11月26日
小贴士
相关VIP内容
数据中心产业图谱研究报告,41页pdf
专知会员服务
53+阅读 · 2022年1月31日
视频隐私保护技术综述
专知会员服务
34+阅读 · 2022年1月19日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
专知会员服务
34+阅读 · 2021年10月17日
专知会员服务
79+阅读 · 2021年7月28日
专知会员服务
55+阅读 · 2021年6月9日
相关资讯
Spark & Hive 云原生改造在智领云的应用
CSDN
0+阅读 · 2022年4月8日
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
ADBPG&Greenplum成本优化之磁盘水位管理
阿里技术
0+阅读 · 2022年1月12日
如何降低云计算基础设施的复杂度?
InfoQ
0+阅读 · 2022年1月4日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员