转载机器之心报道 编辑:泽南、小舟这可能是当今最全面、最新的深度学习概述之一。 爆火的深度学习领域,最近又有了热门学习资料。

近日,麻省理工出版社的新书《Understanding Deep Learning》(深入理解深度学习)迎来了中文版。

这本书一共分为 21 个章节,涵盖了深度学习领域的许多关键概念,包括基本构建、Transformer 架构、图神经网络 GNN、强化学习 RL、扩散模型等等。对于不论是初学者,还是已有工作经验的开发者来说都有极高的价值。

GitHub 链接:https://github.com/careywyr/UnderstandingDeepLearning-ZH-CN * 书籍原链接:https://udlbook.github.io/udlbook/

目前,该书的英文电子版下载量已达到 34.4 万。

该书的实体版本在去年 12 月正式发布,全书共 541 页,不过它的电子版一直在继续更新。目前在网站上,作者还提供了 68 个 Python 笔记本练习,可以帮助读者通过编程实践加深理解。

本书希望以准确易懂的方式,向人们介绍深度学习的基础思想,旨在帮助刚入门的读者理解深度学习背后的原理。对于想要深入理解本书内容的读者来说,只需要本科水平的数学知识就能读懂。

具体来说,该书在前面的部分介绍了深度学习模型,并讨论了如何训练、评估这些模型,如何提高它们的性能的方法。在接下来的部分,作者会带领我们考察专门用于图像、文本和图数据的架构。后续的章节探讨了生成模型和强化学习。倒数第二章探讨了这些以及其他尚未完全理解的方面。最后一章讨论了 AI 伦理。

目录

第一章 - Introduction 介绍 第二章 - Supervised learning 监督学习 第三章 - Shallow neural networks 浅层神经网络 第四章 - Deep neural networks 深度神经网络 第五章 - Loss functions 损失函数 第六章 - Fitting models 训练模型 第七章 - Gradients and initialization 梯度和初始化 第八章 - Measuring performance 性能评估 第九章 - Regularization 正则化 第十章 - Convolutional networks 卷积网络 第十一章 - Residual networks 残差网络 第十二章 - Transformers 第十三章 - Graph neural networks 图神经网络 第十四章 - Unsupervised learning 无监督学习 第十五章 - Generative adversarial networks 生成对抗网络 第十六章 - Normalizing flows 标准化流 第十七章 - Variational autoencoders 变分自编码器 第十八章 - Diffusion models 扩散模型 第十九章 - Deep reinforcement learning 深度强化学习 第二十章 - Why does deep learning work? 为什么深度学习有效? 第二十一章 - Deep learning and ethics 深度学习与伦理

作者介绍

《深入理解深度学习》的作者是英国巴斯大学(University of Bath)计算机科学教授 Simon J.D. Prince,他专注于研究计算机视觉和计算机图形学。

领英资料显示,Simon J.D. Prince 十几年来一直在研究机构从事计算机科学和 AI 研究工作,例如曾在软件开发公司 Anthropics Technology 担任 7 年首席科学家。2022 年,他加入巴斯大学任名誉教授。

Simon J.D. Prince 已在顶级会议(CVPR、ICCV、SIGGRAPH 等)上发表超过 50 篇论文。他还是《计算机视觉:模型、学习和推理》的作者。

参考链接: https://x.com/tuturetom/status/1814689613304508777

成为VIP会员查看完整内容
80

无人驾驶飞行器(UAV)又称无人机,它的发展给航空业带来了革命性的变化,并已成为现代战争的一部分。无人机最初是为军队开发的,用于执行对人类来说 "枯燥、肮脏或危险 "的任务,如今,无人机已被用于支持大量非军事任务,如治安和监视、航空摄影、包裹递送、森林火灾监测和扑救、农业、基础设施检查和科学工作等。无人机的军事用途始于越南战争,但在伊拉克冲突以及后来的阿富汗冲突中都有广泛使用。最近,在阿塞拜疆与亚美尼亚的冲突中,智能无人机的使用使阿塞拜疆明显占了上风。土耳其的 TB-2 无人机被乌克兰非常有效地用于收集情报,以对付强大得多的俄罗斯。显然,无人驾驶飞机技术现已成为增强战斗力的手段。

大多数无人机都有一名操控员,他从远程位置驾驶无人机,通过安全的通信链路控制无人机的使用。人工智能(IA)和机器学习(ML)以及高速机载计算的进步使无人机能够自主运行。在大多数空中任务中,无人机正在迅速取代人类。无人机被用于空中加油,无人驾驶旋翼机在移动的船只上自主着陆,无人机利用太阳能执行长时间飞行任务,还有无人驾驶或可选择有人驾驶的战斗机。无人机正在成千上万地组成完全协调的飞行群。有人机-无人机空中编队,即一架有人机控制一组无人机。这种编队将利用两种类型的优势。作战无人机正被用于情报、监视和侦察(ISR)、电子战、地面打击任务和空中作战。大型无人机执行货运任务的工作已经开始。实际上,有朝一日无人机将执行所有类型的空中任务。

无人机的尺寸和重量多种多样。无人机的分类还与其最大工作高度和航程有关。无人机可以小到昆虫,也可以大到客机。飞行高度带可以与有人驾驶飞机一样高。如果人类不在平台上,续航时间甚至可以长达数月。同样,无人机在进行高 "g "机动时也不再受人类生理机能的限制。无人机可以以超音速飞行,以后甚至可以以高超音速飞行。太空已经被无人系统所占据,因此,航空航天领域未来也会有更多的无人系统。

实际上,世界上所有重要的空军部队都拥有无人机。许多国家都在制造无人机和小型无人机。美国、以色列和中国在无人机制造领域处于全球领先地位。土耳其也正在成为一个重要的出口国。数以百万计的业余无人机在全球各地飞行。四旋翼无人机是业余无线电遥控飞机和玩具广泛流行的例证。

无人驾驶航空通勤飞行器已经过测试,很快就会出现在空中。这需要国际民用航空组织(ICAO)的规定,包括空中规则。还有适航认证问题。无人机遥控驾驶员需要进行分类,并获得有效期为 10 年的遥控驾驶员培训组织(RPTO)认证。必须为市内通勤指定特定的城市空中走廊。空中交通管理将面临新的动态。无人机销售也需要通过独特的识别号码和许可证进行监管。

战斗无人机拥有更大的自主权,可以在没有决策干预的情况下自由攻击和杀害人类,这涉及伦理和法律问题,需要加以解决。在无人机中,人类仍将以某种形式处于环路中,即使这意味着决定算法并拥有一定的优先权或否决权。设计板上的大多数高端未来飞机仍以飞行员为中心。因此,尽管无人驾驶飞行器取得了进步,但飞行员仍需要一些年才能看到空中的彩虹和高空的日落。

在伊拉克、阿富汗和伊朗等国,无人机曾被用来追踪和杀害人类。最近,一个配备致命武器的自主杀人机器人在利比亚袭击人类。无人机正被用于定点清除重要人物。2020 年 1 月 3 日,伊朗少将卡西姆-苏莱曼尼在巴格达国际机场被美军无人机击毙。2022 年 5 月初,911 袭击的实施者之一艾曼-扎瓦希里(Ayman al-Zawahiri)在喀布尔的一次超视距无人机袭击行动中丧生,当时他作为塔利班的客人居住在喀布尔。

无人机已被用于走私武器和毒品。恐怖分子可以利用无人机攻击目标,甚至击落飞机。携带小型手榴弹的无人机群可以神风特攻队的方式飞入大型集会,制造混乱。

由于无人机已成为一种强大的空中武器平台,使用反无人驾驶航空系统使其失效就变得非常重要。由于无人机体积小、特征低,探测总是会延迟。先进的雷达和光电探测手段正在不断发展。可以通过动能手段使用硬杀伤武器击落无人机,也可以使用电子战技术使其失效,或发射一张网缠住旋翼。

反无人机系统(C-UAS)技术的兴起主要是由于在民用和战时环境中不断扩大使用无人机(体积小、价格低的系统)所带来的新威胁。与探测系统一样,没有一种拦截系统是完全有效的。由于无人机技术的扩散,反无人机系统将不可避免地成为未来所有冲突中无处不在的武器。这些反无人机系统必须足够灵活,能够探测到各种形状和大小的无人机并使其失效。

本专著试图对无人机和反无人机技术在军事和民用领域的发展进行环境扫描,以及这些技术如何试图改变现代战争的性质,从低强度冲突到全面战争

该专著分为三个部分,首先从历史角度介绍了无人机作为空中力量的一个要素是如何演变的。

第一部分用六章介绍了无人机技术,涉及无人机的组件、操作、技术进步以及影响其操作的法律问题等各个方面。

第二部分有两章,涉及与反无人机系统有关的操作和技术方面。

第三部分有两章,总结了目前使用这些系统的启示,以及在塑造这两种系统未来发展方向方面的经验教训。最后一章总结了无人机和反无人机的主题。

成为VIP会员查看完整内容
58

实践使用GPT 3.5、GPT 4、LangChain、Llama 2、Falcon LLM等构建LLM驱动的复杂AI应用

**关键特点

  • 将大型语言模型(LLMs)嵌入实际应用中
  • 使用LangChain在应用中协调LLMs及其组件
  • 掌握基本和高级的提示工程技术

**图书简介

《构建LLM应用》深入探讨了LLMs提供的基本概念、前沿技术和实际应用,最终为扩展AI能力的大型基础模型(LFMs)的出现铺平了道路。 本书首先深入介绍了LLMs。接着,我们探索了各种主流的架构框架,包括专有模型(GPT 3.5/4)和开源模型(Falcon LLM),分析它们的独特优势和差异。随后,重点介绍了基于Python的轻量级框架LangChain。我们引导读者通过使用LLMs和强大的工具包创建能够从非结构化数据中检索信息并与结构化数据交互的智能代理。此外,书中还探讨了超越语言建模的LFMs领域,涵盖各种AI任务和模态,如视觉和音频。 无论你是经验丰富的AI专家还是该领域的新手,这本书都是你解锁LLMs全部潜力并开启智能机器新时代的路线图。

**你将学到什么

  • LLMs架构的核心组件,包括编码-解码块、嵌入等
  • 熟悉GPT-3.5/4、Llama 2和Falcon LLM等LLMs的独特功能
  • 使用LangChain等AI协调器,Streamlit作为前端
  • 熟悉LLMs组件,如内存、提示和工具
  • 学习非参数化知识、嵌入和向量数据库
  • 了解LFMs对AI研究和行业应用的影响
  • 通过微调自定义你的LLMs
  • 学习LLM驱动应用的伦理影响

**适合对象

本书适合希望通过LLMs构建应用的软件工程师和数据科学家。本书也适合对应用LLM主题感兴趣的技术领导者、学生和研究人员。 我们不假设读者之前有LLM的相关经验,但读者应具备基本的机器学习/软件工程基础,以理解和应用内容。

**目录

  1. 介绍LLMs
  2. LLMs用于AI驱动的应用
  3. 为你的应用选择LLM
  4. 在应用中嵌入LLMs
  5. 构建对话应用
  6. 开发搜索和推荐引擎
  7. 生成文本应用
  8. 处理结构化数据的LLMs
  9. 生成代码和结构化输出
  10. 构建多模态代理
  11. 微调LLMs
  12. 负责任的AI
  13. 新兴趋势和创新

**关于作者

在完成了金融学学士学位后,Valentina Alto于2021年获得数据科学硕士学位。她在微软开始了职业生涯,担任Azure解决方案专家,自2022年以来,主要专注于在制造和制药行业工作,与数据和AI解决方案相关。Valentina与系统集成商紧密合作,特别关注部署结合现代数据平台、数据网格框架和机器学习及人工智能应用的云架构。 在学术研究过程中,她热衷于AI和Python编程,积极撰写有关统计、机器学习、深度学习和AI的技术文章,并在各种出版物上发表。

成为VIP会员查看完整内容
40

**简介

通过理论理解深度强化学习(deep RL)中最流行的库,本新版专注于深度RL的最新进展,采用代码学习的方法,使读者能够理解并复现该领域的最新研究。

**深度强化学习的最新进展

本书介绍了从游戏、机器人到金融的新代理环境,帮助读者尝试将强化学习应用于不同领域。多智能体强化学习章节涵盖了多个智能体的竞争方式,另一章节则专注于广泛使用的深度RL算法——近端策略优化(Proximal Policy Optimization, PPO)。读者将了解如何通过大型语言模型(如ChatGPT)使用人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)来提升对话能力。

**实践与部署

本书还将介绍在多个云系统上使用代码和在Hugging Face Hub等平台上部署模型的步骤。代码采用Jupyter Notebook格式,可以在Google Colab等深度学习云平台上运行,允许读者根据自己的需求调整代码。无论是在游戏、机器人还是生成AI应用中,《Deep Reinforcement Learning with Python》都将帮助您保持技术前沿。

**学习内容

  • 探索基于Python的RL库,包括StableBaselines3和CleanRL
  • 使用多样化的RL环境,如Gymnasium、Pybullet和Unity ML
  • 理解使用RLHF和PPO进行大型语言模型的指令微调
  • 学习使用Hugging Face、Weights and Biases和Optuna的训练和优化技术

**适合人群

本书适合希望提升对深度RL理解并获取实际实现RL算法技能的软件工程师和机器学习开发者。通过本书,您将能够从头开始实现并优化RL算法,掌握前沿技术应用于实际项目。

成为VIP会员查看完整内容
34

《移动计算的未来》带领读者全面了解快速发展的移动技术领域。书籍以详尽探讨该领域的基础概念为开端,深入解析边缘计算这一变革性技术。随后的章节涵盖了移动计算的各个方面,涉及可持续农业解决方案、最新的移动硬件和设计趋势,以及人工智能在移动环境中的重要作用。书中重点介绍了智能移动助手,强调了机器学习的影响。读者将了解塑造可持续移动技术的环保创新以及移动计算在智慧城市中的实际应用。书中还详细探讨了隐私和安全挑战,提供了保护用户数据的强大策略。其他章节则介绍了增强现实和虚拟现实在现代移动计算环境中的变革潜力。书中还探索了如多模态人工智能嵌入区块链安全的智能学生监控等创新方法,以及移动计算与心理健康分析的独特交集。书籍在结尾对变革性技术及其与移动计算的融合进行了前瞻性探讨,提供了在创新前沿导航的宝贵见解。总体而言,本书是寻求全面了解未来移动技术的个人必不可少的资源。

成为VIP会员查看完整内容
28

**《C++中的面向对象软件设计》**通过研究优质和劣质代码,学习面向对象设计的基础知识!设计良好的应用程序运行更高效,错误更少,更易于修订和维护。《C++中的面向对象软件设计》通过引人入胜的“前后对比”方法,向你展示了糟糕软件的样子,并教你如何通过良好的设计原则和模式来修复它。在《C++中的面向对象软件设计》中,你将发现:

  • 通过设计-编码-测试的迭代改进代码

  • 收集需求以确保你正在开发正确的应用程序

  • 解决编程问题的设计原则,如封装和委托

  • 包括观察者设计模式在内的设计模式,修复架构问题

  • 使用递归和多线程简化常见解决方案 《C++中的面向对象软件设计》是一本至关重要的指南,帮助你构建由专业人士交付的高性能应用程序——所有这些都使用经过行业验证的设计原则和模式。你将学习如何收集和分析需求,以确保你正在构建客户真正需要的东西,通过迭代开发追溯错误,并建立一个设计模式工具箱,用于排除应用程序架构中的常见问题。书中的示例使用C++17编写,但其通用原则可以应用于任何面向对象的语言。购买印刷版图书可免费获得来自Manning Publications的PDF和ePub格式的电子书。关于技术良好的设计是优秀软件的基础。掌握面向对象设计原则是创建运行快速、错误少、长久耐用应用程序的最可靠方法。本书专为新手C++程序员编写,以易读的方式引导你掌握设计优秀软件的艺术。关于本书《C++中的面向对象软件设计》以清晰、无行话的语言介绍了面向对象设计原则、实践和模式。立刻熟悉的前后对比示例突显了良好设计的好处。每一章都充满了友好的对话,预见你的疑问并帮助指出你可能忽略的细节。在此过程中,你将获得关于地道C++风格的提示,使你的代码更具特色。书中内容

  • 设计-编码-测试迭代

  • 常见编程问题的设计原则

  • 用通俗语言解释的架构设计模式

  • 递归和多线程 读者对象示例使用C++17编写。作者简介罗纳德·马克(Ronald Mak)是圣荷西州立大学面向对象分析与设计的高评价讲师。他的职业生涯包括担任NASA和JPL的高级计算机科学家,参与了诸如火星探测器和猎户座航天器等重大任务。罗纳德的专业领域包括IBM的研究,劳伦斯利弗莫尔国家实验室的企业软件战略,以及苹果和Sun Microsystems的高级职位。他拥有斯坦福大学的数学科学和计算机科学学位,并拥有12项软件专利。《C++中的面向对象软件设计》是他的第六本书。目录****第一部分

  1. 通往良好设计软件的路径
  2. 通过迭代实现良好设计 第二部分3. 收集需求以构建正确的应用程序 4. 良好的类设计以正确构建应用程序第三部分5. 隐藏类实现 6. 不要让用户感到意外 7. 正确设计子类第四部分8. 模板方法和策略设计模式 9. 工厂方法和抽象工厂设计模式 10. 适配器和外观设计模式 11. 迭代器和访问者设计模式 12. 观察者设计模式 13. 状态设计模式 14. 单例、组合和装饰者设计模式第五部分15. 使用递归和回溯设计解决方案 16. 设计多线程程序
成为VIP会员查看完整内容
22
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员