这些是我在2020年秋季在莫斯科物理与技术研究所(MIPT)和Yandex数据分析学院(YSDA)做的演讲笔记。这些笔记涵盖了初始化、损失曲面、泛化和神经切线核理论的一些方面。虽然许多其他的主题(如表达性,平均场理论,双下降现象)在当前版本中缺失,我们计划在未来的修订中添加它们。
https://www.zhuanzhi.ai/paper/2fc29465d202ea8e657db29311027617