正规化路径:平行RLU网络的中央和分级吸引常规化 (Path Regularization: A Convexity and Sparsity Inducing Regularization for Parallel ReLU Networks) - 专知论文

会员服务 ·

0

正则化项 · ReLU · 特化 · 全局优化 · 优化器 ·

2021 年 10 月 25 日

Path Regularization: A Convexity and Sparsity Inducing Regularization for Parallel ReLU Networks

翻译：正规化路径:平行RLU网络的中央和分级吸引常规化

Tolga Ergen,Mert Pilanci

from arxiv, arXiv admin note: text overlap with arXiv:2110.05518

Despite several attempts, the fundamental mechanisms behind the success of deep neural networks still remain elusive. To this end, we introduce a novel analytic framework to unveil hidden convexity in training deep neural networks. We consider a parallel architecture with multiple ReLU sub-networks, which includes many standard deep architectures and ResNets as its special cases. We then show that the training problem with path regularization can be cast as a single convex optimization problem in a high-dimensional space. We further prove that the equivalent convex program is regularized via a group sparsity inducing norm. Thus, a path regularized parallel architecture with ReLU sub-networks can be viewed as a parsimonious feature selection method in high-dimensions. More importantly, we show that the computational complexity required to globally optimize the equivalent convex problem is polynomial-time with respect to the number of data samples and feature dimension. Therefore, we prove exact polynomial-time trainability for path regularized deep ReLU networks with global optimality guarantees. We also provide several numerical experiments corroborating our theory.

翻译：尽管进行了几次尝试,但深神经网络成功背后的基本机制仍然难以找到。为此,我们引入了一个新的分析框架,以揭开深神经网络培训中隐藏的共性。我们把多个RELU子网络的平行结构视为其特例,其中包括许多标准的深层建筑和ResNet。然后我们表明,路径正规化的培训问题可以作为一个高维空间的单一锥形优化问题来呈现。我们进一步证明,相当的锥形程序通过一个群集聚性诱导规范而正规化。因此,与RELU子网络的路径正规化平行结构可以被视为高二元中一种相似的特征选择方法。更重要的是,我们表明,全球优化等同的锥形问题所需的计算复杂性在数据样本数量和特征方面是多元时的。因此,我们证明,对具有全球最佳性保障的正统化深RELU网络路径的精确多元时训练。我们还提供了数个数字实验,以证实我们理论的理论。

0

相关内容

正则化项

深度学习优化算法，73页ppt，Optimization Algorithms on Deep Learning

深度学习优化算法，73页ppt，Optimization Algorithms on Deep Learning

专知会员服务

135+阅读 · 2021年6月16日

【港中文CMSC5743】深度神经网络高效计算

专知会员服务

32+阅读 · 2020年10月9日

《常微分方程》笔记，419页pdf

《常微分方程》笔记，419页pdf

专知会员服务

74+阅读 · 2020年8月2日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

【阿尔托大学】图神经网络，Graph Neural Networks，附60页ppt

【阿尔托大学】图神经网络，Graph Neural Networks，附60页ppt

专知会员服务

183+阅读 · 2020年4月26日

【资源推荐】深度学习技巧速查清单《CS 230 - Deep Learning Tips and Tricks Cheatsheet》by Afshine Amidi, Shervine Amidi

【资源推荐】深度学习技巧速查清单《CS 230 - Deep Learning Tips and Tricks Cheatsheet》by Afshine Amidi, Shervine Amidi

专知会员服务

27+阅读 · 2019年12月19日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

已删除

将门创投

3+阅读 · 2019年5月6日

A Stochastic Bregman Primal-Dual Splitting Algorithm for Composite Optimization

Arxiv

0+阅读 · 2021年12月22日

A Convergent ADMM Framework for Efficient Neural Network Training

Arxiv

0+阅读 · 2021年12月22日

More is Less: Inducing Sparsity via Overparameterization

Arxiv

0+阅读 · 2021年12月21日

Vector-output ReLU Neural Network Problems are Copositive Programs: Convex Analysis of Two Layer Networks and Polynomial-time Algorithms

Arxiv

0+阅读 · 2021年12月21日

Neural Mean Discrepancy for Efficient Out-of-Distribution Detection

Arxiv

0+阅读 · 2021年12月20日

Sparsity in Deep Learning: Pruning and growth for efficient inference and training in neural networks

Arxiv

14+阅读 · 2021年1月31日

Distributed Graph Convolutional Networks

Arxiv

19+阅读 · 2020年7月13日

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

Arxiv

8+阅读 · 2019年5月20日

Neural Ordinary Differential Equations

Arxiv

6+阅读 · 2018年10月3日

Pointer Networks

Arxiv

4+阅读 · 2017年1月2日

VIP会员

文章信息

相关主题

相关VIP内容

深度学习优化算法，73页ppt，Optimization Algorithms on Deep Learning

深度学习优化算法，73页ppt，Optimization Algorithms on Deep Learning

专知会员服务

135+阅读 · 2021年6月16日

【港中文CMSC5743】深度神经网络高效计算

专知会员服务

32+阅读 · 2020年10月9日

《常微分方程》笔记，419页pdf

《常微分方程》笔记，419页pdf

专知会员服务

74+阅读 · 2020年8月2日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

【阿尔托大学】图神经网络，Graph Neural Networks，附60页ppt

【阿尔托大学】图神经网络，Graph Neural Networks，附60页ppt

专知会员服务

183+阅读 · 2020年4月26日

【资源推荐】深度学习技巧速查清单《CS 230 - Deep Learning Tips and Tricks Cheatsheet》by Afshine Amidi, Shervine Amidi

【资源推荐】深度学习技巧速查清单《CS 230 - Deep Learning Tips and Tricks Cheatsheet》by Afshine Amidi, Shervine Amidi

专知会员服务

27+阅读 · 2019年12月19日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

已删除

将门创投

3+阅读 · 2019年5月6日

相关论文

A Stochastic Bregman Primal-Dual Splitting Algorithm for Composite Optimization

Arxiv

0+阅读 · 2021年12月22日

A Convergent ADMM Framework for Efficient Neural Network Training

Arxiv

0+阅读 · 2021年12月22日

More is Less: Inducing Sparsity via Overparameterization

Arxiv

0+阅读 · 2021年12月21日

Vector-output ReLU Neural Network Problems are Copositive Programs: Convex Analysis of Two Layer Networks and Polynomial-time Algorithms

Arxiv

0+阅读 · 2021年12月21日

Neural Mean Discrepancy for Efficient Out-of-Distribution Detection

Arxiv

0+阅读 · 2021年12月20日

Sparsity in Deep Learning: Pruning and growth for efficient inference and training in neural networks

Arxiv

14+阅读 · 2021年1月31日

Distributed Graph Convolutional Networks

Arxiv

19+阅读 · 2020年7月13日

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

Arxiv

8+阅读 · 2019年5月20日

Neural Ordinary Differential Equations

Arxiv

6+阅读 · 2018年10月3日

Pointer Networks

Arxiv

4+阅读 · 2017年1月2日

微信扫码咨询专知VIP会员