简介:本书《动手学深度学习》,作者:Aston Zhang, Zachary C. Lipton, Mu Li, and Alexander J. Smola。
面向中文读者的能运行、可讨论的深度学习教科书
含 NumPy/MXNet、PyTorch 和 TensorFlow 实现
被全球 55 个国家 300 所大学用于教学
⼏年前,在⼤公司和初创公司中,并没有⼤量的深度学习科学家开发智能产品和服务。我们中年轻⼈(作者) 进⼊这个领域时,机器学习并没有在报纸上获得头条新闻。我们的⽗⺟根本不知道什么是机器学习,更不⽤ 说为什么我们可能更喜欢机器学习,而不是从事医学或法律职业。机器学习是⼀⻔具有前瞻性的学科,在现 实世界的应⽤范围很窄。而那些应⽤,例如语⾳识别和计算机视觉,需要⼤量的领域知识,以⾄于它们通常 被认为是完全独⽴的领域,而机器学习对于这些领域来说只是⼀个小组件。因此,神经⽹络——我们在本书 中关注的深度学习模型的前⾝,被认为是过时的⼯具。就在过去的五年⾥,深度学习给世界带来了惊喜,推动了计算机视觉、⾃然语⾔处理、⾃动语⾳识别、强化 学习和统计建模等领域的快速发展。有了这些进步,我们现在可以制造⽐以往任何时候都更⾃主的汽⻋(不 过可能没有⼀些公司试图让你相信的那么⾃主),可以⾃动起草普通邮件的智能回复系统,帮助⼈们从令⼈ 压抑的⼤收件箱中挖掘出来。在围棋等棋类游戏中,软件超越了世界上最优秀的⼈,这曾被认为是⼏⼗年后 的事。这些⼯具已经对⼯业和社会产⽣了越来越⼴泛的影响,改变了电影的制作⽅式、疾病的诊断⽅式,并 在基础科学中扮演着越来越重要的⻆⾊——从天体物理学到⽣物学。
• 第⼀部分包括基础知识和预备知识。1节 提供深度学习的⼊⻔课程。然后在 2节 中,我们将快速向你介 绍实践深度学习所需的前提条件,例如如何存储和处理数据,以及如何应⽤基于线性代数、微积分和概 率基本概念的各种数值运算。3节 和 4节 涵盖了深度学习的最基本概念和技术,例如线性回归、多层感 知机和正则化。
• 接下来的五章集中讨论现代深度学习技术。5节 描述了深度学习计算的各种关键组件,并为我们随后 实现更复杂的模型奠定了基础。接下来,在 6节 和 7节 中,我们介绍了卷积神经⽹络(convolutional neural network,CNN),这是构成⼤多数现代计算机视觉系统⻣⼲的强⼤⼯具。随后,在 8节 和 9节 中,我们引⼊了循环神经⽹络(recurrent neural network,RNN),这是⼀种利⽤数据中的时间或序列 结构的模型,通常⽤于⾃然语⾔处理和时间序列预测。在 10节 中,我们介绍了⼀类新的模型,它采⽤ 了⼀种称为注意⼒机制的技术,最近它们已经开始在⾃然语⾔处理中取代循环神经⽹络。这⼀部分将 帮助你快速了解⼤多数现代深度学习应⽤背后的基本⼯具。
• 第三部分讨论可伸缩性、效率和应⽤程序。⾸先,在 chap_optimization 中,我们讨论了⽤于训练深度 学习模型的⼏种常⽤优化算法。下⼀章 11节 将探讨影响深度学习代码计算性能的⼏个关键因素。在 12节 中,我们展⽰了深度学习在计算机视觉中的主要应⽤。在 chap_nlp_pretrain 和 chap_nlp_app 中,我们展⽰了如何预训练语⾔表⽰模型并将其应⽤于⾃然语⾔处理任务。
https://zh-v2.d2l.ai/
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DL2022” 就可以获取《最新819页pdf《动⼿学深度学习》2022版》专知下载链接