项目名称: 分布式有监督学习的学习理论

项目编号: No.61502342

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 自动化技术、计算机技术

项目作者: 林绍波

作者单位: 温州大学

项目金额: 20万元

中文摘要: 进入大数据时代,机器学习面临两个重大挑战,即如何设计能够适用于大数据的机器学习算法,以及如何发展相应的理论来支撑其应用。针对第一个挑战,众多学者提出了利用分而治之策略来处理数据的分布式学习方法。虽然有大量的文献从工程的角度证明了这种方法的可行性,但是迄今为止还没有完整的理论来支撑其应用。本项目就分布式学习的统计性态、分布学习算法的收敛性、学习过程的复杂性等基础理论问题开展研究,拟建立一套完整的适用于分布式有监督学习的学习理论。主要内容包括:第一,从理论上证明分布式有监督学习的可行性及优越性;第二,建立适用于分布式有监督学习的泛化误差分解体系并导出其泛化误差。第三,从理论的角度揭示该如何有效地使用分布式学习算法来处理监督学习问题。

中文关键词: 统计学习理论;泛化能力;泛化误差

英文摘要: Machine learning encounters two fundamental challenges in the big data age, namely how to design machine learning algorithms that can be applied to the big data process and how to provide a theoretical analysis framework for the algorithms. Distributed learning employs the “divide-and-conquer” strategy to attack the machine learning problem,and then becomes a state-of-the-art learning scheme in the big data era. Compared with enormous research activities on the applications, the theoretical study of the distributed learning algorithms lags heavily behind. In this project, we focus on presenting a systemic theoretical analysis for the distributed supervised learning in the framework of statistical learning theory. To this end, we will first verify the feasibility and outperformance of the distributed learning. Then, we will develop an exclusive error decomposition strategy for the distributed supervised learning and deduce its generalization error bound. Finally, we will present a theoretical guidance for how to design an efficient distributed learning algorithm.

英文关键词: Statistical learning theory;Generalization capability;Generalization error

成为VIP会员查看完整内容
13

相关内容

【经典书】半监督学习,524页pdf
专知会员服务
134+阅读 · 2021年8月20日
专知会员服务
96+阅读 · 2021年8月13日
【2021新书】分布式优化,博弈和学习算法,227页pdf
专知会员服务
215+阅读 · 2021年5月25日
「数据数学:从理论到计算」EPFL硬核课程
专知会员服务
42+阅读 · 2021年1月31日
【经典书】模式识别概率理论,654页pdf
专知会员服务
77+阅读 · 2021年1月21日
GCN如何并行化?分布式图卷积神经网路,13页pdf
专知会员服务
33+阅读 · 2020年7月20日
【硬核书】可扩展机器学习:并行分布式方法
专知会员服务
80+阅读 · 2020年5月23日
周志华的《机器学习》西瓜书出全新视频课啦!
数据分析
16+阅读 · 2019年6月10日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
七本书籍带你打下机器学习和数据科学的数学基础
基于信息理论的机器学习
专知
21+阅读 · 2017年11月23日
【推荐】伪标签学习导论 - 一种半监督学习方法
机器学习研究会
12+阅读 · 2017年10月5日
范式大学|迁移学习实战:从算法到实践
机器学习研究会
15+阅读 · 2017年8月9日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
49+阅读 · 2021年5月9日
Arxiv
11+阅读 · 2021年3月25日
Arxiv
22+阅读 · 2019年11月24日
小贴士
相关VIP内容
【经典书】半监督学习,524页pdf
专知会员服务
134+阅读 · 2021年8月20日
专知会员服务
96+阅读 · 2021年8月13日
【2021新书】分布式优化,博弈和学习算法,227页pdf
专知会员服务
215+阅读 · 2021年5月25日
「数据数学:从理论到计算」EPFL硬核课程
专知会员服务
42+阅读 · 2021年1月31日
【经典书】模式识别概率理论,654页pdf
专知会员服务
77+阅读 · 2021年1月21日
GCN如何并行化?分布式图卷积神经网路,13页pdf
专知会员服务
33+阅读 · 2020年7月20日
【硬核书】可扩展机器学习:并行分布式方法
专知会员服务
80+阅读 · 2020年5月23日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
49+阅读 · 2021年5月9日
Arxiv
11+阅读 · 2021年3月25日
Arxiv
22+阅读 · 2019年11月24日
微信扫码咨询专知VIP会员