深度学习网络已经被训练成能够识别语音、标题图片和在不同语言之间翻译文本的高水平表现。尽管深度学习网络在解决现实问题中的应用已经变得无处不在,但我们对它们为何如此有效的理解却很匮乏。根据统计的样本复杂度和非凸优化理论,这些经验结果是不可能的。然而,在训练和深度学习网络的有效性方面的悖论正在被研究,并在高维空间的几何结构中发现了真知灼见。一个关于深度学习的数学理论将阐明它们是如何运作的,使我们能够评估不同网络架构的优缺点,并导致重大的改进。深度学习为人类与数字设备的交流提供了自然的方式,是构建人工一般智能的基础。深度学习的灵感来自大脑皮层的结构,对自主性和一般智力的洞察可能会在其他对规划和生存至关重要的大脑区域找到,但实现这些目标需要重大突破。