神经网络学习率设置 - 专知

会员服务 ·

0

神经网络学习率设置

2018 年 3 月 3 日 机器学习研究会

点击上方 “机器学习研究会”可以订阅

摘要

转自：爱可可-爱生活

In previous posts, I've discussed how we can train neural networks usingbackpropagation with gradient descent. One of the key hyperparameters to set in order to train a neural network is the learning rate for gradient descent. As a reminder, this parameter scales the magnitude of our weight updates in order to minimize the network's loss function.

If your learning rate is set too low, training will progress very slowly as you are making very tiny updates to the weights in your network. However, if your learning rate is set too high, it can cause undesirable divergent behavior in your loss function. I'll visualize these cases below - if you find these visuals hard to interpret, I'd recommend reading (at least) the first section in my post on gradient descent.

链接：

https://www.jeremyjordan.me/nn-learning-rate/

原文链接：

https://m.weibo.cn/1402400261/4213361128315325

“完整内容”请点击【阅读原文】

↓↓↓

登录查看更多

4

相关内容

学习率

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

因果图，Causal Graphs，52页ppt

因果图，Causal Graphs，52页ppt

专知会员服务

250+阅读 · 2020年4月19日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

95+阅读 · 2020年3月12日

Diganta Misra等人提出新激活函数Mish，在一些任务上超越RuLU

Diganta Misra等人提出新激活函数Mish，在一些任务上超越RuLU

专知会员服务

15+阅读 · 2019年10月15日

开源书：PyTorch深度学习起步

开源书：PyTorch深度学习起步

专知会员服务

51+阅读 · 2019年10月11日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

专知会员服务

65+阅读 · 2019年10月9日

什么是学习率，以及它是如何影响深度学习的

什么是学习率，以及它是如何影响深度学习的

论智

85+阅读 · 2018年2月3日

从零开始：教你如何训练神经网络

从零开始：教你如何训练神经网络

机器之心

5+阅读 · 2017年12月11日

手把手教你估算深度神经网络的最优学习率（附代码&教程）

手把手教你估算深度神经网络的最优学习率（附代码&教程）

数据分析

6+阅读 · 2017年11月30日

如何找到最优学习率？

如何找到最优学习率？

AI研习社

11+阅读 · 2017年11月29日

【教程】如何估算深度神经网络的最优学习率

【教程】如何估算深度神经网络的最优学习率

GAN生成式对抗网络

5+阅读 · 2017年11月18日

教程 | 如何估算深度神经网络的最优学习率

教程 | 如何估算深度神经网络的最优学习率

机器之心

3+阅读 · 2017年11月17日

【推荐】决策树/随机森林深入解析

【推荐】决策树/随机森林深入解析

机器学习研究会

5+阅读 · 2017年9月21日

【推荐】神经网络调试经验汇编：神经网络不好使该咋办？

【推荐】神经网络调试经验汇编：神经网络不好使该咋办？

机器学习研究会

5+阅读 · 2017年9月5日

用神经网络训练一个文本分类器

用神经网络训练一个文本分类器

Python开发者

3+阅读 · 2017年8月19日

【推荐】TensorFlow手把手CNN实践指南

【推荐】TensorFlow手把手CNN实践指南

机器学习研究会

5+阅读 · 2017年8月17日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

Binarized Knowledge Graph Embeddings

Arxiv

4+阅读 · 2019年2月8日

Reversible Recurrent Neural Networks

Arxiv

3+阅读 · 2018年10月25日

Reducing Parameter Space for Neural Network Training

Arxiv

3+阅读 · 2018年8月17日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

Generalization without systematicity: On the compositional skills of sequence-to-sequence recurrent networks

Arxiv

3+阅读 · 2018年6月6日

Optimal Algorithms for Non-Smooth Distributed Optimization in Networks

Arxiv

7+阅读 · 2018年6月1日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Online Deep Metric Learning

Arxiv

8+阅读 · 2018年5月15日

Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments

Arxiv

6+阅读 · 2018年1月16日

VIP会员

相关主题

损失函数（机器学习）

Neural Networks

相关VIP内容

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

因果图，Causal Graphs，52页ppt

因果图，Causal Graphs，52页ppt

专知会员服务

250+阅读 · 2020年4月19日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

95+阅读 · 2020年3月12日

Diganta Misra等人提出新激活函数Mish，在一些任务上超越RuLU

Diganta Misra等人提出新激活函数Mish，在一些任务上超越RuLU

专知会员服务

15+阅读 · 2019年10月15日

开源书：PyTorch深度学习起步

开源书：PyTorch深度学习起步

专知会员服务

51+阅读 · 2019年10月11日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

专知会员服务

65+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】基于物理的模拟

流匹配在生物学与生命科学中的应用综述

高质量数据集实践指南（1.0）

ICML 2025 关于语言模型机械可解释性的教程

相关资讯

什么是学习率，以及它是如何影响深度学习的

什么是学习率，以及它是如何影响深度学习的

论智

85+阅读 · 2018年2月3日

从零开始：教你如何训练神经网络

从零开始：教你如何训练神经网络

机器之心

5+阅读 · 2017年12月11日

手把手教你估算深度神经网络的最优学习率（附代码&教程）

手把手教你估算深度神经网络的最优学习率（附代码&教程）

数据分析

6+阅读 · 2017年11月30日

如何找到最优学习率？

如何找到最优学习率？

AI研习社

11+阅读 · 2017年11月29日

【教程】如何估算深度神经网络的最优学习率

【教程】如何估算深度神经网络的最优学习率

GAN生成式对抗网络

5+阅读 · 2017年11月18日

教程 | 如何估算深度神经网络的最优学习率

教程 | 如何估算深度神经网络的最优学习率

机器之心

3+阅读 · 2017年11月17日

【推荐】决策树/随机森林深入解析

【推荐】决策树/随机森林深入解析

机器学习研究会

5+阅读 · 2017年9月21日

【推荐】神经网络调试经验汇编：神经网络不好使该咋办？

【推荐】神经网络调试经验汇编：神经网络不好使该咋办？

机器学习研究会

5+阅读 · 2017年9月5日

用神经网络训练一个文本分类器

用神经网络训练一个文本分类器

Python开发者

3+阅读 · 2017年8月19日

【推荐】TensorFlow手把手CNN实践指南

【推荐】TensorFlow手把手CNN实践指南

机器学习研究会

5+阅读 · 2017年8月17日

相关论文

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

Binarized Knowledge Graph Embeddings

Arxiv

4+阅读 · 2019年2月8日

Reversible Recurrent Neural Networks

Arxiv

3+阅读 · 2018年10月25日

Reducing Parameter Space for Neural Network Training

Arxiv

3+阅读 · 2018年8月17日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

Generalization without systematicity: On the compositional skills of sequence-to-sequence recurrent networks

Arxiv

3+阅读 · 2018年6月6日

Optimal Algorithms for Non-Smooth Distributed Optimization in Networks

Arxiv

7+阅读 · 2018年6月1日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Online Deep Metric Learning

Arxiv

8+阅读 · 2018年5月15日

Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments

Arxiv

6+阅读 · 2018年1月16日

大家都在搜

国防科技创新

智库最新报告

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员