近年来,深度学习已经成为机器学习和计算机视觉、自然语言处理等相关领域的中心范式。但是对这一努力的许多方面的数学理解仍然缺乏。训练何时成功,速度有多快? 用了多少例子? 各种架构的优点和局限性是什么? 本书重点研究深度学习的理论方面。