MIT&Facebook新书《深度学习理论的原理》，449页pdf阐述理解神经网络的有效理论方法 - 专知VIP

会员服务 ·

47

深度学习理论 · 神经网络 ·

2021 年 6 月 20 日

MIT&Facebook新书《深度学习理论的原理》，449页pdf阐述理解神经网络的有效理论方法

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

蒸汽机为工业革命提供了动力，并永远地改变了制造业——但直到接下来的一个世纪，热力学定律和统计力学原理得到发展，科学家们才能够在理论层面上全面解释蒸汽机为何以及如何工作。

当然，缺乏理论理解并没有阻止人们对蒸汽机的改进，但是热机原理的发现导致了迅速的改进。当科学家们最终掌握了统计力学，其结果远远超出了制造更好、更高效的发动机。统计力学使人们认识到物质是由原子构成的，它预示了量子力学的发展，(如果你从整体上看)甚至使我们看到了为我们今天使用的计算机提供动力的晶体管。

如今，人工智能正处于类似的关头。深度神经网络(DNNs)是现代人工智能研究的一部分，但它们或多或少被视为一个“黑盒子”。尽管人工智能从业者取得了重大进展，但DNN通常被认为过于复杂，无法从基本原理理解。模型在很大程度上是通过反复试验来调整的——虽然反复试验可以通过多年的经验来明智地进行，但却没有任何统一的理论语言来描述DNN及其功能。

《深度学习理论原理:理解神经网络的有效理论方法》的新书出版，该研究由Facebook AI Research的Sho Yaida、麻省理工学院和Salesforce的Dan Roberts以及普林斯顿的Boris Hanin共同完成。作为一个基本的层面，这本书提供了一个从第一原则理解DNNs的理论框架。对于人工智能从业者来说，这种理解可以显著减少训练这些DNN所需的试错次数。例如，它可以揭示任何给定模型的最佳超参数，而不需要经过今天所需要的时间和计算密集的实验。

《深度学习理论原理》将于2022年初由剑桥大学出版社出版，手稿现已公开。斯坦福大学物理学教授伊娃·西尔弗斯坦(Eva Silverstein)说:“这本书提出了一种机器学习理论方法。”看到这些方法在理解和改进人工智能方面取得的进展将是令人兴奋的。

这只是重塑人工智能科学这一更大项目的第一步，这一项目既源自基本原理，同时也专注于描述现实模型的实际工作方式。如果成功，这种深度学习的一般理论可能会使人工智能模型更加强大，甚至可能引导我们建立一个研究通用智能方面的框架。

https://ai.facebook.com/blog/advancing-ai-theory-with-a-first-principles-understanding-of-deep-neural-networks/

成为VIP会员查看完整内容

相关内容

深度学习理论

深度学习理论

【经典书】深度学习信息瓶颈理论，135页pdf

专知会员服务

98+阅读 · 2021年8月13日

《深度学习理论原理》新书稿451页pdf，Facebook、MIT等联合发表，阐述理解神经网络的一种有效理论方法

《深度学习理论原理》新书稿451页pdf，Facebook、MIT等联合发表，阐述理解神经网络的一种有效理论方法

专知会员服务

172+阅读 · 2021年8月5日

【普林斯顿硬核书】深度学习理论，118页pdf

专知会员服务

92+阅读 · 2021年6月11日

Francis Bach《第一性原理机器学习理论》干货书，233页pdf

专知会员服务

87+阅读 · 2021年5月30日

【干货书】深度学习架构: 一种数学方法，768页pdf

【干货书】深度学习架构: 一种数学方法，768页pdf

专知会员服务

195+阅读 · 2021年5月15日

自然语言处理现代方法，176页pdf

自然语言处理现代方法，176页pdf

专知会员服务

269+阅读 · 2021年2月22日

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

专知会员服务

59+阅读 · 2021年1月29日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知会员服务

239+阅读 · 2020年12月15日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

物理学突破深度学习理论瓶颈？ Google-斯坦福发布《深度学习统计力学》综述论文，30页pdf阐述深度学习成功机制

物理学突破深度学习理论瓶颈？ Google-斯坦福发布《深度学习统计力学》综述论文，30页pdf阐述深度学习成功机制

专知会员服务

108+阅读 · 2020年3月26日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知

29+阅读 · 2020年6月3日

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

专知

10+阅读 · 2019年3月12日

Python 神经网络编程

Python 神经网络编程

人工智能头条

10+阅读 · 2019年2月27日

如何优雅地从四个方面加深对深度学习的理解

如何优雅地从四个方面加深对深度学习的理解

数盟

6+阅读 · 2018年9月3日

深度学习对话系统理论篇--数据集和评价指标介绍

深度学习对话系统理论篇--数据集和评价指标介绍

黑龙江大学自然语言处理实验室

7+阅读 · 2018年5月10日

浅入浅出深度学习理论与实践

浅入浅出深度学习理论与实践

机器学习研究会

5+阅读 · 2018年2月28日

8个深度学习方面的最佳实践

8个深度学习方面的最佳实践

深度学习世界

10+阅读 · 2018年1月25日

从零学习：从Python和R理解和编码神经网络（完整版）

从零学习：从Python和R理解和编码神经网络（完整版）

论智

24+阅读 · 2017年12月16日

资源｜斯坦福课程：深度学习理论！

资源｜斯坦福课程：深度学习理论！

全球人工智能

17+阅读 · 2017年11月9日

学完吴恩达全部深度学习课程，这有一份课程解读

学完吴恩达全部深度学习课程，这有一份课程解读

THU数据派

14+阅读 · 2017年10月27日

InfoGram and Admissible Machine Learning

InfoGram and Admissible Machine Learning

Arxiv

0+阅读 · 2021年8月20日

Learning-to-learn non-convex piecewise-Lipschitz functions

Arxiv

0+阅读 · 2021年8月19日

Scaling Laws for Deep Learning

Arxiv

0+阅读 · 2021年8月17日

Sparsity in Deep Learning: Pruning and growth for efficient inference and training in neural networks

Arxiv

14+阅读 · 2021年1月31日

Pipeline PSRO: A Scalable Approach for Finding Approximate Nash Equilibria in Large Games

Arxiv

3+阅读 · 2020年6月15日

The Deep Learning Revolution and Its Implications for Computer Architecture and Chip Design

The Deep Learning Revolution and Its Implications for Computer Architecture and Chip Design

Arxiv

7+阅读 · 2019年11月13日

Meta-Learning with Differentiable Convex Optimization

Arxiv

5+阅读 · 2019年4月23日

Quantization Mimic: Towards Very Tiny CNN for Object Detection

Quantization Mimic: Towards Very Tiny CNN for Object Detection

Arxiv

5+阅读 · 2018年9月13日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

Named Entities troubling your Neural Methods? Build NE-Table: A neural approach for handling Named Entities

Arxiv

4+阅读 · 2018年4月22日

VIP会员

相关主题

深度学习理论

相关VIP内容

【经典书】深度学习信息瓶颈理论，135页pdf

专知会员服务

98+阅读 · 2021年8月13日

《深度学习理论原理》新书稿451页pdf，Facebook、MIT等联合发表，阐述理解神经网络的一种有效理论方法

《深度学习理论原理》新书稿451页pdf，Facebook、MIT等联合发表，阐述理解神经网络的一种有效理论方法

专知会员服务

172+阅读 · 2021年8月5日

【普林斯顿硬核书】深度学习理论，118页pdf

专知会员服务

92+阅读 · 2021年6月11日

Francis Bach《第一性原理机器学习理论》干货书，233页pdf

专知会员服务

87+阅读 · 2021年5月30日

【干货书】深度学习架构: 一种数学方法，768页pdf

【干货书】深度学习架构: 一种数学方法，768页pdf

专知会员服务

195+阅读 · 2021年5月15日

自然语言处理现代方法，176页pdf

自然语言处理现代方法，176页pdf

专知会员服务

269+阅读 · 2021年2月22日

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

专知会员服务

59+阅读 · 2021年1月29日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知会员服务

239+阅读 · 2020年12月15日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

物理学突破深度学习理论瓶颈？ Google-斯坦福发布《深度学习统计力学》综述论文，30页pdf阐述深度学习成功机制

物理学突破深度学习理论瓶颈？ Google-斯坦福发布《深度学习统计力学》综述论文，30页pdf阐述深度学习成功机制

专知会员服务

108+阅读 · 2020年3月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知

29+阅读 · 2020年6月3日

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

专知

10+阅读 · 2019年3月12日

Python 神经网络编程

Python 神经网络编程

人工智能头条

10+阅读 · 2019年2月27日

如何优雅地从四个方面加深对深度学习的理解

如何优雅地从四个方面加深对深度学习的理解

数盟

6+阅读 · 2018年9月3日

深度学习对话系统理论篇--数据集和评价指标介绍

深度学习对话系统理论篇--数据集和评价指标介绍

黑龙江大学自然语言处理实验室

7+阅读 · 2018年5月10日

浅入浅出深度学习理论与实践

浅入浅出深度学习理论与实践

机器学习研究会

5+阅读 · 2018年2月28日

8个深度学习方面的最佳实践

8个深度学习方面的最佳实践

深度学习世界

10+阅读 · 2018年1月25日

从零学习：从Python和R理解和编码神经网络（完整版）

从零学习：从Python和R理解和编码神经网络（完整版）

论智

24+阅读 · 2017年12月16日

资源｜斯坦福课程：深度学习理论！

资源｜斯坦福课程：深度学习理论！

全球人工智能

17+阅读 · 2017年11月9日

学完吴恩达全部深度学习课程，这有一份课程解读

学完吴恩达全部深度学习课程，这有一份课程解读

THU数据派

14+阅读 · 2017年10月27日

相关论文

InfoGram and Admissible Machine Learning

InfoGram and Admissible Machine Learning

Arxiv

0+阅读 · 2021年8月20日

Learning-to-learn non-convex piecewise-Lipschitz functions

Arxiv

0+阅读 · 2021年8月19日

Scaling Laws for Deep Learning

Arxiv

0+阅读 · 2021年8月17日

Sparsity in Deep Learning: Pruning and growth for efficient inference and training in neural networks

Arxiv

14+阅读 · 2021年1月31日

Pipeline PSRO: A Scalable Approach for Finding Approximate Nash Equilibria in Large Games

Arxiv

3+阅读 · 2020年6月15日

The Deep Learning Revolution and Its Implications for Computer Architecture and Chip Design

The Deep Learning Revolution and Its Implications for Computer Architecture and Chip Design

Arxiv

7+阅读 · 2019年11月13日

Meta-Learning with Differentiable Convex Optimization

Arxiv

5+阅读 · 2019年4月23日

Quantization Mimic: Towards Very Tiny CNN for Object Detection

Quantization Mimic: Towards Very Tiny CNN for Object Detection

Arxiv

5+阅读 · 2018年9月13日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

Named Entities troubling your Neural Methods? Build NE-Table: A neural approach for handling Named Entities

Arxiv

4+阅读 · 2018年4月22日

微信扫码咨询专知VIP会员