在将近两千年的时间里,“几何学”一词一直是欧几里得几何学的同义词,因为没有其他类型的几何学存在。欧几里得的垄断地位在19世纪结束了,许多非欧几里得几何学的例子被展示出来。尽管如此,这些研究很快就分化成不同的领域,数学家们争论不同几何形状之间的关系和定义一个几何的是什么。菲利克斯·克莱因在他的Erlangen程序中提出了一种摆脱困境的方法,该程序提出将几何学作为使用群论语言研究不变量或对称性的方法。在20世纪,这些思想是发展现代物理学的基础,最终形成了标准模型。
深度学习目前的状态有点像19世纪的几何学领域:一方面,在过去十年中,深度学习给数据科学带来了一场革命,使许多以前被认为无法完成的任务成为可能,包括计算机视觉、围棋或蛋白质折叠。同时,我们有各种各样的神经网络架构,但很少有统一的原则。就像过去一样,很难理解不同方法之间的关系,不可避免地导致了对相同概念的再创造和再品牌。
几何深度学习的目标是在Erlangen计划的思想下为深度学习带来几何统一。它提供了一个共同的数学框架来研究最成功的神经网络架构,如CNNs、RNNs、GNNs和transformer,并提供了一个建设性的过程来将先前的知识融入到神经网络中,并以一种原则性的方式构建未来的架构。
在这次演讲中,我将概述几何深度学习在网格、图形和流形上的数学原理,并展示这些方法在计算机视觉、社会科学、生物学和药物设计领域的一些令人兴奋和开创性的应用。