神经演化(Neuroevolution),即通过进化计算优化神经网络,自 1990 年代以来一直是机器学习领域中不断发展的一个重要分支。其主要关注点在于:当训练目标未知、且良好性能依赖于跨时间的多步决策时(如机器人控制、游戏博弈与决策制定),如何为智能体进化出高性能的神经网络。近年来,神经演化的研究范围进一步扩展到深度学习架构优化、生物智能演化机制的理解,以及面向硬件实现的神经网络优化。 本书将向学生介绍神经演化的基础知识,随后深入探讨多项使神经演化更高效、更通用的高级主题,回顾典型应用领域,并提出未来研究问题。书中还通过一个基于 Python 的软件平台提供动手实践,包括动画、交互式演示、练习与项目环境。我们希望你能从中获益!

为了说明神经演化的本质,考虑下面四个挑战(图 1.1): 想象你想在一款你扮演搜救人员的视频游戏中创建一个角色。这个角色是你的助手:侦察有用信息、协助搬动大型物体等。你希望它能够预判你的意图,并以可信、类人(human-like)的方式行动:像你一样,它的资源有限,但通常能很好地利用这些资源。你要如何设计这样一个角色?它的许多特征很难精确定义:你只能在看到时才知道它是否合理。 再想象一场新的大流行正在出现。它似乎特别影响脆弱人群,似乎在拥挤环境中通过空气传播,并具有较长的潜伏期。这种疾病已在多个国家导致住院,一些国家也采取了应对措施,例如关闭学校、限制航空旅行、开展接触者追踪。最终,病原体可能会被测序,疫苗和药物也可能被开发出来,但我们必须立即应对疾病的传播。我们能否从世界各地的经验中学习,为不同国家、甚至城市与社区的当前状况提出定制化的干预建议? 你是一名零售企业的分析师,试图预测不同商品在不同门店的销量,以最小化库存与浪费。你拥有包含产品描述、季节性变化与经济指标等的历史数据,理论上可以用深度学习进行预测。然而数据量还不够:如此复杂的网络很可能仅仅记住这些小规模数据,而不能在未来很好地泛化。然而,关于其他类型销量、以及其他经济与零售指标的数据却非常丰富。你能否设计一种深度学习架构,利用所有这些其他数据集来提升对你目标数据的预测能力? 你是一名生物学家,研究某一物种的行为,例如鬣狗。你发现它们在某些情况下能够执行极其复杂的协作动作,从而战胜一群狮子。虽然鬣狗在许多社会性任务上都表现不错,但这一行为显得超出了它们通常的能力范围。我们是否正在观察进化本身,即一种可能最终导致社会智能飞跃的适应?这个假设无法在野外或实验室中直接验证。我们是否可以构建计算模拟来为此提供证据? 以上四个例子均展示了神经演化在发挥作用。神经演化,即通过进化计算优化神经网络设计,是人工智能工具箱中一种与众不同的方法。其理念并非优化单一数量化指标,而是寻找能够同时实现多个目标的解决方案,其中一些目标甚至可能定义模糊;不是用它来取代人类的创造力和决策权,而是将其作为一种强大的发现工具来扩展人类能力;不是通过编码和应用已有有效方案来解决问题,而是去发现具有创造性、有效且往往令人惊讶、难以找到的解决方案;不是创建静态、僵硬的系统,而是发展能够在不可预测、不断变化的世界中泛化并适应的行为。因此,通过神经演化,可以开发基于人工智能的决策过程,从而改善工程、科学乃至整个社会。 本书旨在为读者提供神经演化在各种应用中所需的概念性与实践性知识,并推动其进一步发展。本章将从神经演化机制的高层概述开始,将其与其他类型的创造性 AI 进行比较,识别神经演化最有可能产生重大影响的机会。之后本书主体将依次回顾进化计算基础、利用编码与多样性的技术、构建智能体的方法、增强与利用其他学习系统(如深度学习、类脑系统、强化学习与生成式 AI),以及如何进行生物建模并从中获得洞见。

本书对这些主题进行了全面介绍。其目标不仅是让读者熟悉各种神经演化技术,还要提供能够利用这些技术、进一步发展它们并构建应用系统所需的工具。书中回顾了主要算法,并解释了它们的起源与动机;给出了具体的应用示例,并在文献中提供相关参考;指出了若干开放研究领域,并提出进一步研究的建议。此外,本书还通过多个深入的案例研究展示如何利用这些概念解决现实世界中更复杂的挑战与问题。 虽然本书假设读者具备神经网络的基本知识,但对进化计算并不要求较多背景。作为配套资源,书籍网站还提供了若干演示、练习以及一个通用的软件平台。其理念是为读者提供不仅是理论知识,还包括可直接应用和扩展的实用工具。 神经演化这一领域兴起于 20 世纪 80 年代末,其早期成果来自 Belew、McInerney 和 Schraudolph(1992),Harp、Samad 和 A. Guha(1989),Kitano(1990),G. F. Miller、P. Todd 和 Hedge(1989),Mjolsness、Sharp 和 Alpert(1989),Montana 和 L. Davis(1989),Mühlenbein 和 Kindermann(1989),Schaffer、Caruana 和 Eshelman(1990),以及 Whitley 和 T. Hanson(1989)。其发展历程大约每十年都会以综述形式记录下来(Floreano、Dürr 和 Mattiussi,2008;Hougen 和 Shah,2019;Schaffer、Whitley 和 Eshelman,1992;Stanley、Clune、Lehman 等,2019;Yao,1999)。本书并不试图涵盖该领域的全部内容,而是希望以一种“导览式”的方式提供一个逻辑清晰的发展脉络。 因此,全书内容被组织为五个主要部分。 第一部分 通过一系列逐渐增加复杂度的例子,向读者介绍进化计算的基本原理。随后以简单示例引入神经演化的具体情形。首批练习用于帮助读者将这些概念快速具体化和应用(软件平台在下一节介绍)。 第二部分 聚焦神经演化中的两个核心设计要点:网络编码(直接编码与间接编码)以及通过多样性提升搜索效率。通过示例澄清不同编码方法之间的重要区别,比较遗传多样性与行为多样性,引入新颖性搜索(novelty search)与质量-多样性搜索(quality-diversity search),并介绍如何利用多样性进行集成学习(ensembling)。这些方法均是神经演化工具箱中的基础手段,但以往很少被清晰地区分。 第三部分 聚焦智能体:即如何从低层控制演化出有效行为,再提升到高层策略,最终支持决策系统。随后将视角从个体智能体扩展到协作与竞争的群体系统。接下来回顾交互式演化(interactive evolution),其作为结合机器探索与人类洞察的方法。最后,讨论开放式发现(open-ended discovery)的机会与挑战,其灵感来自生物进化,并回顾现有人工系统中开放式创新的实例。 第四部分 将神经演化扩展到与其他学习方法的结合。首先回顾深度学习架构设计方法,讨论其中存在的挑战与未来机会。随后将元学习(meta-learning)扩展到神经网络设计的其他方面,包括损失函数、激活函数、数据使用方式、学习方法及其协同效应。并进一步探讨神经形态系统、强化学习与生成式 AI 的协同组合,指出在这些场景中均可利用进化来优化整体设定,从而提升其他学习方法的效果。 第五部分 探讨神经演化如何为生物进化研究提供洞见,从理解神经结构与模块化,到发育过程、身体与大脑的协同进化,再到生物行为、突破性能力以及语言演化。全文中还识别了许多对未来“生物启发工程系统(bio-inspired engineering)”的潜在启示。结语(Epilogue)指出神经演化在构建具有人工通用智能(AGI)的智能体中可能扮演的角色。 总之,神经演化已成为近期 AI 革命中的第三个新兴组成部分。它使得构建能够生成行为、策略与决策能力的智能体成为可能。而这些智能体在现实世界中拥有广泛应用,可构建更高效、更可靠、成本更低的系统,进而改善人类生活。与此同时,该领域也仍然蕴含大量未来研究机会。

成为VIP会员查看完整内容
37

从基础概念到高级实现,本书全面探讨 DeepSeek-V3 模型,重点介绍其基于 Transformer 的架构、技术创新与应用实践。 本书首先系统讲解理论基础,包括自注意力机制、位置编码、专家混合(Mixture of Experts, MoE)机制以及分布式训练策略。随后深入解析 DeepSeek-V3 的技术进展,如稀疏注意力机制、FP8 混合精度训练以及分层负载均衡,这些技术共同提升了模型的内存效率与能耗表现。通过案例研究与 API 集成方法,本书展示了模型在文本生成、数学推理和代码补全等任务上的高性能能力。本书还重点介绍了 DeepSeek 的开放平台,涵盖安全的 API 身份验证、并发开发策略以及面向可扩展 AI 应用的实时数据处理。此外,本书也探讨了行业应用案例,如聊天客户端开发,以及如何利用 DeepSeek 的上下文缓存与回调函数实现自动化与预测性维护。 本书主要面向从事大规模 AI 模型研发的人工智能研究者与开发者,是希望深入理解先进 AI 系统的理论基础与实际落地的专业人士不可或缺的参考资料,尤其适用于关注高效、可扩展应用的读者。

成为VIP会员查看完整内容
33

自主武器系统(AWS)的发展——有时也带有“致命性”标签,缩写为LAWS——多年来一直处于激烈讨论之中。众多政治、学术或法律机构及行为体都在辩论这些技术带来的后果和风险,特别是其伦理、社会和政治影响,许多声音呼吁严格监管甚至全球禁止。尽管这些武器备受公众关注且被认为影响重大,但“AWS”这一术语具体指代哪些技术以及它们具备何种能力,却往往出人意料地不明确。AWS可以指无人机、航空母舰、无人空中/地面/海上载具、机器人及机器人士兵,或计算机病毒等网络武器。

这种不确定性之所以存在,尽管(或许正是因为)已有大量定义试图从功能上(例如“一旦激活,自主武器‘无需操作员进一步干预即可选择和攻击目标’”:美国国防部,2023年:第21页)或概念上(源自对自主系统、人工智能或机器学习的理论化)来明确该术语。定义仍为不同类型的技术留下了广阔空间,并且结合关于人工智能的更广泛讨论,也为未来发展的潜力和预测提供了可能。除了术语的模糊性,这些系统在何种意义上以及在多大程度上可被称为“自主”的本质也依然含糊不清。尽管自动化能力的发展无疑在推进(Scharre, 2018; Schwarz, 2018; Packer and Reeves, 2020),人类能动性和干预方式的程度不断降低,但完全超越人类控制、因此被许多人担忧的完全自主武器,在很大程度上仍是一种概念上的可能性,而非实际的军事现实。

这些模糊性导致了巨大的意义空白,而这些空白又往往被想象所填充——这是新技术,特别是人工智能的常见做法(Suchman, 2023)。潜在的现实可以扮演重要角色,因为它们是将专业知识传递到社会其他领域(包括新闻、政策制定、研究、教育和民主决策过程)的工具。因此,关于AWS功能及其后果的看法,受到军事、国家和技术未来想象的启发和塑造。这些想象包括地缘政治情景、伦理问题、国家政策或科幻小说。在安全与军事政策中,这些不同现实之间的相互联系甚至被用作一种方法论——例如,“红队演练”——这意味着应用对潜在未来的创造性虚构描述来为实际决策提供信息(The Red Team, 2021)。另一种应用是兵棋推演,这是一种预见未来军事场景的方法,其起源至少可追溯至19世纪,但已适应当代技术和媒体环境,包括虚拟现实和使用大语言模型的基于人工智能的模拟(Goecks and Waytowich, 2024)。

自主武器的前提,被视为占据着一个自身特有的混合空间,这促使我们探索随之而来的无数现实。本书的基本原理认为,只有承认实际技术发展与其相关的愿景和虚拟场景之间持续而复杂的动态互动,才能理解所讨论的这些现实。正是在这种不确定性——想象、可能性和虚构在此交织——的背景下,自主武器变得极具影响力。它们激发出情感、话语、鼓动、(反)行动、投资、竞争、政策或技术与军事蓝图。

关于自主武器主题的出版物通常侧重于其法律、政治或伦理影响(例如,Bhuta等人,2016;Krishnan,2016),这是评估这些技术的第一层级。也有一些著作讨论了其独特的表征(Graae and Maurer, 2021),以及我们见证和体验它们的方式(Bousquet, 2018; Richardson, 2024)。这些著作的基础也基于前面概述的不同现实。本书引入另一种分析自主武器现实的方法,提出一种第二层级的方法:例如,一个伦理问题不仅仅被框定为伦理问题本身,即沿着提出以下规范性问题的思路:“自动化杀人机器会引发哪些道德问题?” 在本书建议的方法中,伦理问题反而被理解为一个促成因素,它有助于在大众文化、政治、新闻或研究中构建、传播和维持对致命性AWS的特定理解。简言之,伦理话语共同创造了其对象的现实。因此,本书所采取的视角将AWS的不同现实置于前台,进而旨在为现有的辩论揭示其(常常是隐含的)基本假设。

本书这篇引言性章节首先勾勒了军事装备日益自动化的技术和政治发展进程。这些发展在理论上被阐述为既具构成性又具述行性,以涵盖全球范围内在理论和实践中对AWS的动态变化和不同理解。随后,本章就这些现实提出了六点思考,有助于界定和巩固AWS的动态含义,这些含义往往在公众、军事和监管领域受到极大关注。章节最后概述了全书的结构并简要总结了各章的贡献。

全书各部分及章节内容

全书结构分为三个独立部分,分别探讨自主武器的当前现实。每个部分都从特定的视角范式分析自主武器:1. 叙事与理论,2. 技术与物质性,以及 3. 政治与伦理。每个部分的开篇由一位艺术家及其对自主武器的构想引入。这种划分基于对跨越这些领域所阐发的不同意义的分析,这些意义构成了AWS的现实,并强有力地影响着如何感知和对待这项技术。

成为VIP会员查看完整内容
27
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员