本次演讲的目的是讨论深度学习(DL)和理论之间的相互作用。在第一部分,我将讨论动机和方法。我们为什么要研究DL?(1. 为了更好地理解现实世界。2. DL能教给我们关于理论世界的什么。3…)我们应该如何学习DL?(“TCS方法”合适吗?/为什么不?)我支持“经验科学”方法,但以“TCS美学”为指导——更接近物理方法而非纯数学方法。本部分是在本文的基础上进行的。

在第二部分,我将讨论更具体的结果。我将讨论Deep Bootstrap框架,这是一个用于理解深度学习(以及其他领域)泛化的框架。经常有人说,优化是一种不足以捕获泛化的语言。相反,我将展示如何在优化(在线优化和经验优化)中将泛化“简化”为两个问题。这部分是基于与Behnam Neyshabur, Hanie Sedghi的合作。

https://cse.ucsd.edu/research/preetum-nakkiran-theory-seminar

成为VIP会员查看完整内容
32

相关内容

UCL& UC Berkeley | 深度强化学习中的泛化研究综述
专知会员服务
60+阅读 · 2021年11月22日
专知会员服务
50+阅读 · 2021年8月8日
专知会员服务
58+阅读 · 2021年8月8日
专知会员服务
113+阅读 · 2021年7月24日
【NYU-WESLEY MADDOX】贝叶斯神经网络教程,83页ppt
专知会员服务
59+阅读 · 2021年4月15日
MIT《图神经网络的任务结构与泛化》,22页ppt
专知会员服务
23+阅读 · 2021年2月28日
【普林斯顿】持续视角下的机器学习,31页ppt及视频
专知会员服务
23+阅读 · 2020年8月19日
计算机视觉中深度迁移学习,165页PPT
专知
23+阅读 · 2019年8月18日
【干货】最新GAN教程,153PPT附代码
GAN生成式对抗网络
12+阅读 · 2018年9月18日
【报告分享】胡包钢研究员:基于信息理论的机器学习(附报告PPT)
中国科学院自动化研究所
7+阅读 · 2017年12月6日
基于信息理论的机器学习
专知
21+阅读 · 2017年11月23日
Arxiv
22+阅读 · 2021年12月19日
Arxiv
11+阅读 · 2021年12月8日
Disentangled Information Bottleneck
Arxiv
12+阅读 · 2020年12月22日
A Modern Introduction to Online Learning
Arxiv
20+阅读 · 2019年12月31日
VIP会员
相关VIP内容
UCL& UC Berkeley | 深度强化学习中的泛化研究综述
专知会员服务
60+阅读 · 2021年11月22日
专知会员服务
50+阅读 · 2021年8月8日
专知会员服务
58+阅读 · 2021年8月8日
专知会员服务
113+阅读 · 2021年7月24日
【NYU-WESLEY MADDOX】贝叶斯神经网络教程,83页ppt
专知会员服务
59+阅读 · 2021年4月15日
MIT《图神经网络的任务结构与泛化》,22页ppt
专知会员服务
23+阅读 · 2021年2月28日
【普林斯顿】持续视角下的机器学习,31页ppt及视频
专知会员服务
23+阅读 · 2020年8月19日
微信扫码咨询专知VIP会员