本次演讲的目的是讨论深度学习(DL)和理论之间的相互作用。在第一部分,我将讨论动机和方法。我们为什么要研究DL?(1. 为了更好地理解现实世界。2. DL能教给我们关于理论世界的什么。3…)我们应该如何学习DL?(“TCS方法”合适吗?/为什么不?)我支持“经验科学”方法,但以“TCS美学”为指导——更接近物理方法而非纯数学方法。本部分是在本文的基础上进行的。
在第二部分,我将讨论更具体的结果。我将讨论Deep Bootstrap框架,这是一个用于理解深度学习(以及其他领域)泛化的框架。经常有人说,优化是一种不足以捕获泛化的语言。相反,我将展示如何在优化(在线优化和经验优化)中将泛化“简化”为两个问题。这部分是基于与Behnam Neyshabur, Hanie Sedghi的合作。
https://cse.ucsd.edu/research/preetum-nakkiran-theory-seminar