每日三篇 | NIPS 2018关于神经网络训练方面的论文

2018 年 12 月 11 日 论智

1

Training DNNs with Hybrid Block Floating Point

洛桑联邦理工学院的Mario Drumond、Tao LIN、Martin Jaggi、Babak Falsafi在NIPS 2018上发表了一种混合BFP和FP的深度神经网络训练方法HBFP。HBFP在所有点积运算上使用块浮点数(BFP),其他运算上则使用浮点数(FP)。在保持与浮点数相当的精确性的前提下,HBFP使硬件实现的吞吐量可以提高至8.5倍。


地址:http://papers.nips.cc/paper/7327-training-dnns-with-hybrid-block-floating-point

2

How to Start Training: The Effect of Initialization and Architecture

德州农工大学的Boris Hanin和MIT的David Rolnick在NIPS 2018上报告了他们对深度ReLU网络训练早期两种常见失败模式的研究。他们给出了何时出现这两种模式,以及在全连接网络、卷积网络、残差架构中如何避免这两种模式的严格证明。

地址: http://papers.nips.cc/paper/7338-how-to-start-training-the-effect-of-initialization-and-architecture

3

Training Deep Models Faster with Robust, Approximate Importance Sampling

在理论上,重要性采样可以加速监督学习所用的随机梯度下降算法。然而,在实践中很少有人这么做,因为计算重要性的成本很高。华盛顿大学的Tyler B. Johnson、Carlos Guestrin在NIPS 2018上发表了一种称为RAIS的重要性采样过程。通过使用鲁棒优化逼近理想的采样分布,RAIS在提供精确重要性采样的许多益处的同时大大降低了计算开销。

地址:http://papers.nips.cc/paper/7957-training-deep-models-faster-with-robust-approximate-importance-sampling

星标 论智,每天获取最新资讯

登录查看更多
12

相关内容

[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
34+阅读 · 2020年7月5日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
25+阅读 · 2020年5月7日
【CVPR2020-CMU】无数据模型选择,一种深度框架潜力
专知会员服务
22+阅读 · 2020年4月12日
麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》
专知会员服务
50+阅读 · 2020年2月19日
BERT进展2019四篇必读论文
专知会员服务
67+阅读 · 2020年1月2日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
270+阅读 · 2020年1月1日
深度神经网络模型压缩与加速综述
专知会员服务
128+阅读 · 2019年10月12日
周志华教授:如何做研究与写论文?
专知会员服务
154+阅读 · 2019年10月9日
【重磅】61篇NIPS2019深度强化学习论文及部分解读
机器学习算法与Python学习
10+阅读 · 2019年9月14日
异常检测论文大列表:方法、应用、综述
专知
126+阅读 · 2019年7月15日
ICLR 2019论文解读:量化神经网络
机器之心
9+阅读 · 2019年6月13日
AAAI 2019 四个杰出论文奖论文揭晓
算法与数学之美
5+阅读 · 2019年5月11日
生成对抗网络的最新研究进展
AI科技评论
5+阅读 · 2019年2月6日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
论文分类
统计学习与视觉计算组
5+阅读 · 2018年3月13日
Arxiv
45+阅读 · 2019年12月20日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
5+阅读 · 2018年4月22日
Arxiv
6+阅读 · 2018年2月26日
Arxiv
5+阅读 · 2018年1月16日
Arxiv
7+阅读 · 2018年1月10日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关VIP内容
[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
34+阅读 · 2020年7月5日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
25+阅读 · 2020年5月7日
【CVPR2020-CMU】无数据模型选择,一种深度框架潜力
专知会员服务
22+阅读 · 2020年4月12日
麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》
专知会员服务
50+阅读 · 2020年2月19日
BERT进展2019四篇必读论文
专知会员服务
67+阅读 · 2020年1月2日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
270+阅读 · 2020年1月1日
深度神经网络模型压缩与加速综述
专知会员服务
128+阅读 · 2019年10月12日
周志华教授:如何做研究与写论文?
专知会员服务
154+阅读 · 2019年10月9日
相关资讯
【重磅】61篇NIPS2019深度强化学习论文及部分解读
机器学习算法与Python学习
10+阅读 · 2019年9月14日
异常检测论文大列表:方法、应用、综述
专知
126+阅读 · 2019年7月15日
ICLR 2019论文解读:量化神经网络
机器之心
9+阅读 · 2019年6月13日
AAAI 2019 四个杰出论文奖论文揭晓
算法与数学之美
5+阅读 · 2019年5月11日
生成对抗网络的最新研究进展
AI科技评论
5+阅读 · 2019年2月6日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
论文分类
统计学习与视觉计算组
5+阅读 · 2018年3月13日
相关论文
Arxiv
45+阅读 · 2019年12月20日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
5+阅读 · 2018年4月22日
Arxiv
6+阅读 · 2018年2月26日
Arxiv
5+阅读 · 2018年1月16日
Arxiv
7+阅读 · 2018年1月10日
Arxiv
5+阅读 · 2017年12月14日
Top
微信扫码咨询专知VIP会员