项目名称: 云环境下基于BSP模型的大规模不动点迭代计算研究

项目编号: No.61300023

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 张岩峰

作者单位: 东北大学

项目金额: 25万元

中文摘要: 不动点迭代广泛存在于数据挖掘和机器学习算法中,在社会网络分析、高性能计算、推荐系统、搜索引擎、模式识别等领域都有广泛应用。近年来,人们开始利用云环境进行大规模不动点迭代计算以适应大数据处理的需要,这也是当今云计算和大数据领域的研究热点,并且已经取得了一系列研究成果。本申请基于这些已有工作,以BSP(Bulk Synchronous Parallel)模型为基础,研究适合大规模不动点迭代计算的改进BSP模型。针对大数据新形势下的性能优化需求,研究基于多初始点的迭代过程优化、基于差别消息的异步迭代模型、基于数据依赖关系的增量处理技术,从多个方面提高大规模不动点迭代计算的处理速度。另外,为了便于验证和推广研究成果,本课题将基于研究内容,实现一个支持大规模不动点迭代计算的分布式计算框架原型系统。

中文关键词: 分布式计算框架;迭代计算;图处理;BSP;大数据

英文摘要: Fixed point iterations widely exist in data mining and machine learning algorithms. These fixed point iterative algorithms are broadly used in the areas of online social networks, high-performance computing, recommendation systems, search engine, pattern recognition,etc. In recent years, in order to meet the needs of big data processing, people are exploiting cloud environment to launch large-scale fixed point iterative computations, which is a hot research topic in cloud computing and big data. Researchers have proposed a series of approaches and systems to support large-scale fixed point iterative computations under cloud environment. In this proposal, based on these previous works, we extend BSP (Bulk Synchronous Parallel) model to support large-scale fixed point iterative computations. To address the recently emerged challenges in big data processing, we will research on the multi-start iterative process, delta-based asynchronous iteration model, and dependency-based incremental processing. These research works aim at improving the performance of large-scale iterative computations from various aspects. In addition, in order to test and publicize our research results, we will design and implement a distributed computing framework prototype supporting large-scale iterative computations, which will integrate al

英文关键词: distributed computing framework;iterative computation;graph processing;BSP;Big data

成为VIP会员查看完整内容
0

相关内容

高性能计算专家Jack Dongarra获2021年图灵奖
专知会员服务
16+阅读 · 2022年3月30日
「大规模图神经网络系统」最新2022综述:从算法到系统
专知会员服务
110+阅读 · 2022年1月14日
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
专知会员服务
33+阅读 · 2021年10月17日
【WWW2021】 大规模组合K推荐
专知会员服务
42+阅读 · 2021年5月3日
「数据数学:从理论到计算」EPFL硬核课程
专知会员服务
42+阅读 · 2021年1月31日
专知会员服务
80+阅读 · 2020年12月11日
专知会员服务
78+阅读 · 2020年6月20日
【2021图灵奖】授予: 高性能计算先驱Jack Dongarra
深度强化学习实验室
0+阅读 · 2022年3月31日
如何降低云计算基础设施的复杂度?
InfoQ
0+阅读 · 2022年1月4日
微软学者讲座 | 计算生态学与计算环境学如何助力可持续发展
【WWW2021】 大规模组合K推荐
专知
0+阅读 · 2021年5月3日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月17日
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
Arxiv
10+阅读 · 2018年4月19日
小贴士
相关VIP内容
高性能计算专家Jack Dongarra获2021年图灵奖
专知会员服务
16+阅读 · 2022年3月30日
「大规模图神经网络系统」最新2022综述:从算法到系统
专知会员服务
110+阅读 · 2022年1月14日
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
专知会员服务
33+阅读 · 2021年10月17日
【WWW2021】 大规模组合K推荐
专知会员服务
42+阅读 · 2021年5月3日
「数据数学:从理论到计算」EPFL硬核课程
专知会员服务
42+阅读 · 2021年1月31日
专知会员服务
80+阅读 · 2020年12月11日
专知会员服务
78+阅读 · 2020年6月20日
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月17日
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
Arxiv
10+阅读 · 2018年4月19日
微信扫码咨询专知VIP会员