本书的重点是为学生提供对几何的洞察力,帮助他们从一个统一的角度理解深度学习。在这里,我们将深度学习解释为一种可以想象的信号处理技术的最终形式,而不是将其描述为一种实现技术,这在许多现有的深度学习书籍中都是如此。
为了支持这一观点,本文综述了经典的内核机器学习方法,并解释了它们的优势和局限性。从生物学和算法的角度详细解释了深度神经网络的基本构建模块,介绍了注意力、归一化、Transformer、BERT、GPT-3等最新工具。这里的重点也在于,在这些启发式方法中,直觉背后有一个重要的、优雅的几何结构,使我们能够进行系统的理解。为理解高维几何中深度学习的工作机制提供了统一的几何分析方法。然后,从统一的几何角度描述了GAN、VAE、归一化流、最优运输等不同形式的生成模型,表明它们实际上来自于统计距离最小化问题。
因为这本书包含了从实践和理论的观点的最新信息,它可以作为高等院校的高级深度学习教材或作为一个参考来源的研究人员有兴趣获得最新的深度学习算法及其潜在原理。此外,这本书已经为工程和数学学生编写了代码共享课程,因此很多内容是跨学科的,将吸引来自两个学科的学生。