【牛津大学博士论文】高效深度学习优化，192页pdf - 专知VIP

会员服务 ·

30

牛津大学 (University of Oxford) · 深度学习 · 深度学习优化 ·

2023 年 7 月 13 日

【牛津大学博士论文】高效深度学习优化，192页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在过去的10年里，深度神经网络在许多监督学习任务上的性能有了巨大的提升。在此期间，这些模型多次在许多经典的机器视觉和自然语言处理基准上重新定义了最高水平。深度神经网络也被应用到许多实际应用中，包括聊天机器人、艺术生成、语音激活的虚拟助手、监控和医疗诊断系统。这些模型性能的大部分提升可以归因于规模的增加，这反过来又提高了计算和能源成本。在这篇论文中，我们详细介绍了如何降低在各种环境下部署深度神经网络的成本的方法。我们首先关注训练效率，为此，我们提出了两种优化技术，这两种技术可以在没有大量调整的情况下产生高精度的模型。这些优化器只有一个固定的最大步长超参数需要交叉验证，并且我们证明他们在广泛的设置中都优于其他可比较的方法。这些方法不需要繁重的找到好的学习率调度的过程，这通常需要训练同一网络的许多版本，因此它们减少了所需的计算。第一个优化器是一种为插值设置设计的新颖的束方法。第二个展示了Polyak式步长与在线估计最优损失值在非插值设置中的有效性。

接下来，我们将注意力转向训练具有二进制参数和激活的高效二进制网络。在正确的实施下，全二进制网络在推理时间上具有高效率，因为它们可以用更便宜的位运算替换大部分操作。这使得它们非常适合轻量级或嵌入式应用。由于这些模型的离散性质，传统的训练方法不可行。我们提出了一种简单而有效的替代方案，用于优化这些模型的现有技术。

成为VIP会员查看完整内容

50

相关内容

牛津大学 (University of Oxford)

牛津大学 (University of Oxford)

牛津大学是一所英国研究型大学，也是罗素大学集团、英国“G5超级精英大学”，欧洲顶尖大学科英布拉集团、欧洲研究型大学联盟的核心成员。牛津大学培养了众多社会名人，包括了27位英国首相、60位诺贝尔奖得主以及数十位世界各国的皇室成员和政治领袖。2016年9月，泰晤士高等教育发布了2016-2017年度世界大学排名，其中牛津大学排名第一。

【斯坦福博士论文】以数据为中心机器学习的理论与算法，209页pdf

【斯坦福博士论文】以数据为中心机器学习的理论与算法，209页pdf

专知会员服务

85+阅读 · 2023年7月17日

【ETH博士论文】设计高效的深度神经网络：拓扑优化、量化和多任务学习，151页pdf

【ETH博士论文】设计高效的深度神经网络：拓扑优化、量化和多任务学习，151页pdf

专知会员服务

54+阅读 · 2023年5月30日

【佐治亚理工博士论文】用自然语言解释神经网络，157页pdf

【佐治亚理工博士论文】用自然语言解释神经网络，157页pdf

专知会员服务

46+阅读 · 2023年3月14日

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

专知会员服务

32+阅读 · 2023年3月1日

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

专知会员服务

48+阅读 · 2023年2月1日

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

专知会员服务

40+阅读 · 2022年11月29日

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

专知会员服务

38+阅读 · 2022年11月12日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【牛津大学博士论文】自监督学习视频理解，143页pdf

【牛津大学博士论文】自监督学习视频理解，143页pdf

专知会员服务

40+阅读 · 2022年10月11日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知会员服务

130+阅读 · 2022年1月16日

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

专知

5+阅读 · 2023年4月5日

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

专知

6+阅读 · 2022年11月29日

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

专知

3+阅读 · 2022年11月12日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

专知

9+阅读 · 2022年10月30日

【牛津大学博士论文】自监督学习视频理解，143页pdf

【牛津大学博士论文】自监督学习视频理解，143页pdf

专知

1+阅读 · 2022年10月11日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体，176页pdf

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体，176页pdf

专知

4+阅读 · 2022年9月14日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【CMU博士论文】视频多模态学习：探索模型和任务复杂性，152页pdf

【CMU博士论文】视频多模态学习：探索模型和任务复杂性，152页pdf

专知

1+阅读 · 2022年8月10日

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

高精度三维植物建模技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

新视觉模型下非完整移动机器人同时镇定和跟踪控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于近红外成像的双脑神经解码关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

11+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

Implicit regularization of deep residual networks towards neural ODEs

Arxiv

0+阅读 · 2023年9月3日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

VIP会员

相关主题

牛津大学 (University of Oxford)

深度学习优化

相关VIP内容

【斯坦福博士论文】以数据为中心机器学习的理论与算法，209页pdf

【斯坦福博士论文】以数据为中心机器学习的理论与算法，209页pdf

专知会员服务

85+阅读 · 2023年7月17日

【ETH博士论文】设计高效的深度神经网络：拓扑优化、量化和多任务学习，151页pdf

【ETH博士论文】设计高效的深度神经网络：拓扑优化、量化和多任务学习，151页pdf

专知会员服务

54+阅读 · 2023年5月30日

【佐治亚理工博士论文】用自然语言解释神经网络，157页pdf

【佐治亚理工博士论文】用自然语言解释神经网络，157页pdf

专知会员服务

46+阅读 · 2023年3月14日

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

专知会员服务

32+阅读 · 2023年3月1日

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

专知会员服务

48+阅读 · 2023年2月1日

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

专知会员服务

40+阅读 · 2022年11月29日

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

专知会员服务

38+阅读 · 2022年11月12日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【牛津大学博士论文】自监督学习视频理解，143页pdf

【牛津大学博士论文】自监督学习视频理解，143页pdf

专知会员服务

40+阅读 · 2022年10月11日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知会员服务

130+阅读 · 2022年1月16日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

专知

5+阅读 · 2023年4月5日

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

专知

6+阅读 · 2022年11月29日

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

专知

3+阅读 · 2022年11月12日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

专知

9+阅读 · 2022年10月30日

【牛津大学博士论文】自监督学习视频理解，143页pdf

【牛津大学博士论文】自监督学习视频理解，143页pdf

专知

1+阅读 · 2022年10月11日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体，176页pdf

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体，176页pdf

专知

4+阅读 · 2022年9月14日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【CMU博士论文】视频多模态学习：探索模型和任务复杂性，152页pdf

【CMU博士论文】视频多模态学习：探索模型和任务复杂性，152页pdf

专知

1+阅读 · 2022年8月10日

相关基金

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

高精度三维植物建模技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

新视觉模型下非完整移动机器人同时镇定和跟踪控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于近红外成像的双脑神经解码关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

11+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Implicit regularization of deep residual networks towards neural ODEs

Arxiv

0+阅读 · 2023年9月3日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员