分布式有监督学习的学习理论 - 专知基金

会员服务 ·

3

统计学习理论 · 泛化能力 · 泛化误差 ·

2015 年 12 月 31 日

分布式有监督学习的学习理论

国家自然科学基金

国家自然科学基金委员会

项目名称： 分布式有监督学习的学习理论

项目编号： No.61502342

项目类型： 青年科学基金项目

立项/批准年度： 2016

项目学科： 自动化技术、计算机技术

项目作者： 林绍波

作者单位： 温州大学

项目金额： 20万元

中文摘要： 进入大数据时代，机器学习面临两个重大挑战，即如何设计能够适用于大数据的机器学习算法，以及如何发展相应的理论来支撑其应用。针对第一个挑战，众多学者提出了利用分而治之策略来处理数据的分布式学习方法。虽然有大量的文献从工程的角度证明了这种方法的可行性，但是迄今为止还没有完整的理论来支撑其应用。本项目就分布式学习的统计性态、分布学习算法的收敛性、学习过程的复杂性等基础理论问题开展研究，拟建立一套完整的适用于分布式有监督学习的学习理论。主要内容包括：第一，从理论上证明分布式有监督学习的可行性及优越性；第二，建立适用于分布式有监督学习的泛化误差分解体系并导出其泛化误差。第三，从理论的角度揭示该如何有效地使用分布式学习算法来处理监督学习问题。

中文关键词： 统计学习理论；泛化能力；泛化误差

英文摘要： Machine learning encounters two fundamental challenges in the big data age, namely how to design machine learning algorithms that can be applied to the big data process and how to provide a theoretical analysis framework for the algorithms. Distributed learning employs the “divide-and-conquer” strategy to attack the machine learning problem，and then becomes a state-of-the-art learning scheme in the big data era. Compared with enormous research activities on the applications, the theoretical study of the distributed learning algorithms lags heavily behind. In this project, we focus on presenting a systemic theoretical analysis for the distributed supervised learning in the framework of statistical learning theory. To this end, we will first verify the feasibility and outperformance of the distributed learning. Then, we will develop an exclusive error decomposition strategy for the distributed supervised learning and deduce its generalization error bound. Finally, we will present a theoretical guidance for how to design an efficient distributed learning algorithm.

英文关键词： Statistical learning theory;Generalization capability;Generalization error

成为VIP会员查看完整内容

17

相关内容

统计学习理论

统计学习理论

【经典书】从数据中学习，第二版，LEARNING FROM DATA Concepts, Theory, and Methods

专知会员服务

49+阅读 · 2021年9月6日

【经典书】半监督学习，524页pdf

【经典书】半监督学习，524页pdf

专知会员服务

138+阅读 · 2021年8月20日

【经典书】深度学习信息瓶颈理论，135页pdf

专知会员服务

98+阅读 · 2021年8月13日

【2021新书】分布式优化，博弈和学习算法，227页pdf

【2021新书】分布式优化，博弈和学习算法，227页pdf

专知会员服务

236+阅读 · 2021年5月25日

「数据数学:从理论到计算」EPFL硬核课程

「数据数学:从理论到计算」EPFL硬核课程

专知会员服务

44+阅读 · 2021年1月31日

【经典书】模式识别概率理论，654页pdf

【经典书】模式识别概率理论，654页pdf

专知会员服务

87+阅读 · 2021年1月21日

GCN如何并行化？分布式图卷积神经网路，13页pdf

GCN如何并行化？分布式图卷积神经网路，13页pdf

专知会员服务

35+阅读 · 2020年7月20日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知会员服务

42+阅读 · 2020年7月5日

【硬核书】可扩展机器学习：并行分布式方法

【硬核书】可扩展机器学习：并行分布式方法

专知会员服务

86+阅读 · 2020年5月23日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

专知

7+阅读 · 2022年2月21日

迁移学习之域自适应理论简介（Domain Adaptation Theory）

迁移学习之域自适应理论简介（Domain Adaptation Theory）

PaperWeekly

8+阅读 · 2022年2月20日

【博士论文】吉布斯分布的局部、动态与快速采样算法

【博士论文】吉布斯分布的局部、动态与快速采样算法

专知

2+阅读 · 2021年11月26日

【最新】2021年自然语言处理 (NLP) 算法学习路线！

【最新】2021年自然语言处理 (NLP) 算法学习路线！

专知

9+阅读 · 2021年8月5日

周志华的《机器学习》西瓜书出全新视频课啦！

周志华的《机器学习》西瓜书出全新视频课啦！

数据分析

16+阅读 · 2019年6月10日

工行基于MySQL构建分布式架构的转型之路

工行基于MySQL构建分布式架构的转型之路

炼数成金订阅号

15+阅读 · 2019年5月16日

七本书籍带你打下机器学习和数据科学的数学基础

七本书籍带你打下机器学习和数据科学的数学基础

云栖社区

26+阅读 · 2018年4月22日

基于信息理论的机器学习

基于信息理论的机器学习

专知

22+阅读 · 2017年11月23日

【推荐】伪标签学习导论 - 一种半监督学习方法

【推荐】伪标签学习导论 - 一种半监督学习方法

机器学习研究会

12+阅读 · 2017年10月5日

范式大学｜迁移学习实战：从算法到实践

范式大学｜迁移学习实战：从算法到实践

机器学习研究会

16+阅读 · 2017年8月9日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的机器学习理论与方法

国家自然科学基金

4+阅读 · 2013年12月31日

学习理论中相似度量学习及相关课题的研究

国家自然科学基金

2+阅读 · 2013年12月31日

关于大数据处理分布式学习算法的可行性理论研究

国家自然科学基金

3+阅读 · 2013年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

面向多示例数据标注的隐变量支持向量机研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于数据分布评估和支持向量机方法的分布式数据流挖掘模型和算法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于稀疏编码模型的深层学习神经网络

国家自然科学基金

7+阅读 · 2012年12月31日

粒度支持向量机学习方法及应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

Dependent Optics

Arxiv

0+阅读 · 2022年4月20日

Quantum Bayesian Statistical Inference

Arxiv

1+阅读 · 2022年4月19日

Expected $L_2-$discrepancy bound for a class of new stratified sampling models

Arxiv

0+阅读 · 2022年4月19日

Joint Multi-view Unsupervised Feature Selection and Graph Learning

Arxiv

0+阅读 · 2022年4月18日

On Arbitrary Compression for Decentralized Consensus and Stochastic Optimization over Directed Networks

Arxiv

0+阅读 · 2022年4月18日

Sources of Irreproducibility in Machine Learning: A Review

Arxiv

0+阅读 · 2022年4月15日

The Modern Mathematics of Deep Learning

Arxiv

49+阅读 · 2021年5月9日

Recent Advances in Large Margin Learning

Arxiv

12+阅读 · 2021年3月25日

Learning Latent Representations to Influence Multi-Agent Interaction

Arxiv

11+阅读 · 2020年11月12日

Causality for Machine Learning

Arxiv

26+阅读 · 2019年11月24日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

统计学习理论

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】《知识图谱与大语言模型的协同应用》，544页pdf

军事通信系统：安全行动的支柱

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

【新书】机器学习系统，2620页pdf

相关VIP内容

【经典书】从数据中学习，第二版，LEARNING FROM DATA Concepts, Theory, and Methods

专知会员服务

49+阅读 · 2021年9月6日

【经典书】半监督学习，524页pdf

【经典书】半监督学习，524页pdf

专知会员服务

138+阅读 · 2021年8月20日

【经典书】深度学习信息瓶颈理论，135页pdf

专知会员服务

98+阅读 · 2021年8月13日

【2021新书】分布式优化，博弈和学习算法，227页pdf

【2021新书】分布式优化，博弈和学习算法，227页pdf

专知会员服务

236+阅读 · 2021年5月25日

「数据数学:从理论到计算」EPFL硬核课程

「数据数学:从理论到计算」EPFL硬核课程

专知会员服务

44+阅读 · 2021年1月31日

【经典书】模式识别概率理论，654页pdf

【经典书】模式识别概率理论，654页pdf

专知会员服务

87+阅读 · 2021年1月21日

GCN如何并行化？分布式图卷积神经网路，13页pdf

GCN如何并行化？分布式图卷积神经网路，13页pdf

专知会员服务

35+阅读 · 2020年7月20日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知会员服务

42+阅读 · 2020年7月5日

【硬核书】可扩展机器学习：并行分布式方法

【硬核书】可扩展机器学习：并行分布式方法

专知会员服务

86+阅读 · 2020年5月23日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

相关资讯

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

专知

7+阅读 · 2022年2月21日

迁移学习之域自适应理论简介（Domain Adaptation Theory）

迁移学习之域自适应理论简介（Domain Adaptation Theory）

PaperWeekly

8+阅读 · 2022年2月20日

【博士论文】吉布斯分布的局部、动态与快速采样算法

【博士论文】吉布斯分布的局部、动态与快速采样算法

专知

2+阅读 · 2021年11月26日

【最新】2021年自然语言处理 (NLP) 算法学习路线！

【最新】2021年自然语言处理 (NLP) 算法学习路线！

专知

9+阅读 · 2021年8月5日

周志华的《机器学习》西瓜书出全新视频课啦！

周志华的《机器学习》西瓜书出全新视频课啦！

数据分析

16+阅读 · 2019年6月10日

工行基于MySQL构建分布式架构的转型之路

工行基于MySQL构建分布式架构的转型之路

炼数成金订阅号

15+阅读 · 2019年5月16日

七本书籍带你打下机器学习和数据科学的数学基础

七本书籍带你打下机器学习和数据科学的数学基础

云栖社区

26+阅读 · 2018年4月22日

基于信息理论的机器学习

基于信息理论的机器学习

专知

22+阅读 · 2017年11月23日

【推荐】伪标签学习导论 - 一种半监督学习方法

【推荐】伪标签学习导论 - 一种半监督学习方法

机器学习研究会

12+阅读 · 2017年10月5日

范式大学｜迁移学习实战：从算法到实践

范式大学｜迁移学习实战：从算法到实践

机器学习研究会

16+阅读 · 2017年8月9日

相关基金

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的机器学习理论与方法

国家自然科学基金

4+阅读 · 2013年12月31日

学习理论中相似度量学习及相关课题的研究

国家自然科学基金

2+阅读 · 2013年12月31日

关于大数据处理分布式学习算法的可行性理论研究

国家自然科学基金

3+阅读 · 2013年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

面向多示例数据标注的隐变量支持向量机研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于数据分布评估和支持向量机方法的分布式数据流挖掘模型和算法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于稀疏编码模型的深层学习神经网络

国家自然科学基金

7+阅读 · 2012年12月31日

粒度支持向量机学习方法及应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Dependent Optics

Arxiv

0+阅读 · 2022年4月20日

Quantum Bayesian Statistical Inference

Arxiv

1+阅读 · 2022年4月19日

Expected $L_2-$discrepancy bound for a class of new stratified sampling models

Arxiv

0+阅读 · 2022年4月19日

Joint Multi-view Unsupervised Feature Selection and Graph Learning

Arxiv

0+阅读 · 2022年4月18日

On Arbitrary Compression for Decentralized Consensus and Stochastic Optimization over Directed Networks

Arxiv

0+阅读 · 2022年4月18日

Sources of Irreproducibility in Machine Learning: A Review

Arxiv

0+阅读 · 2022年4月15日

The Modern Mathematics of Deep Learning

Arxiv

49+阅读 · 2021年5月9日

Recent Advances in Large Margin Learning

Arxiv

12+阅读 · 2021年3月25日

Learning Latent Representations to Influence Multi-Agent Interaction

Arxiv

11+阅读 · 2020年11月12日

Causality for Machine Learning

Arxiv

26+阅读 · 2019年11月24日

微信扫码咨询专知VIP会员