生成式人工智能在多个模态(如视觉与语言)中取得了生成高保真输出的显著进展。然而,一个关键挑战仍未解决:我们如何将这些模型引导向特定属性的输出,而不仅仅是复现训练数据中的模式?**奖励引导生成(reward-guided generation)**通过使模型输出对用户定义的奖励函数保持一致,为这一问题提供了解决路径。该方法不仅增强了生成过程的定制性和个性化,还为强化学习、优化和生物设计等领域打开了新的可能性。

要充分释放奖励引导生成的潜力,理解其理论基础与方法论至关重要。本论文提出了一份具有理论支撑的研究路线图,旨在推动奖励引导生成建模的发展,具体包括:(1) 构建对奖励条件生成的理论理解;(2) 设计在经验上表现优异的新算法;(3) 识别并解决现有方法中的关键缺陷,从而提升其可靠性。

为此,第 2 章分析了奖励条件扩散模型(reward-conditioned diffusion models),解释了外部信号如何塑造生成样本的结构及其对应的奖励值。第 3 章提出了一种用于扩散模型的基于梯度的引导方法,该方法在保持对原始数据流形的忠实度的同时,有效融合外部信号。我们对其收敛性进行了分析,展示了预训练模型与奖励信号之间的交互如何既保留了样本质量,又增强了生成控制力。第 4 章研究了大语言模型在基于间隔对齐(margin-based alignment)中的梯度纠缠问题(gradient entanglement),指出过度依赖“偏好输出”与“不偏好输出”之间的对数似然间隔,可能会无意中放大不良响应、压制良好响应,凸显出更明确、解纠缠的奖励目标设计的重要性。

本论文以严谨理论为支撑,并将其凝练为实用算法,推动了奖励引导生成建模的研究,为构建更可控、更具适应性、更可靠的生成模型奠定了坚实基础。

成为VIP会员查看完整内容
2

扩散模型近年来在生成逼真但合成的连续媒体内容方面引起了广泛关注。本次演讲将介绍 Transformer 在图像生成的扩散模型中的应用,并进一步探讨其更广泛的前景。 我们首先简要介绍扩散模型的基础知识以及它们的训练方式,从而建立基本背景。接着,我们讲解曾是扩散模型事实标准的基于 UNet 的网络架构,这将帮助我们理解引入 Transformer 架构并推动其发展的动因。 随后,我们将深入探讨构成基础架构的核心模块,以及在不同条件设定下可以做架构消融实验的自由度。接着,我们将重点介绍当前社区在多个 SoTA 开源模型中用于各种应用场景的多种注意力机制变体及相关组件。

最后,我们将讨论一些围绕效率方面的前沿研究方向,为未来的发展提供启发。 **演讲者简介:**Sayak 目前在 Hugging Face 从事扩散模型相关工作。他的日常工作包括为 diffusers 库贡献代码、训练和调试扩散模型,以及探索应用层面的新想法。他的兴趣方向包括基于主体的生成、偏好对齐和扩散模型的评估。工作之余,他喜欢弹吉他、刷 ICML 教程以及追剧《金装律师》(Suits)。

成为VIP会员查看完整内容
1

战争永恒不变的真相是:它始终随时代演进与参战方可获技术而演变。这种持续进化贯穿战争历史,军事现正基于乌克兰经验面临新一轮创新浪潮。过去十年巡飞弹药的出现为战场士兵与装备带来新威胁。俄乌战场首次大规模采用商用现货采购无人机加装爆炸装置后执行自杀式攻击。通过观察乌克兰对俄大规模作战行动(LSCO)中的运用,无人机战争已占据核心舞台:随着战事持续,每日数千架侦察/巡飞弹药升空作战。在乌克兰战场,巡飞弹药已证明其能及时精准打击预设阵地与车辆,成为乌军机动营连级LSCO行动的无价资产。野战炮兵部队亟需构建为机动营连提供巡飞弹药火力支援的框架,以持续完成兵种使命。

野战炮兵的任务是通过综合火力摧毁/击溃/瓦解敌军,使机动指挥官主导联合地面作战(《美陆军条令参考出版物3-09》)。炮兵兵种旨在运用所有可用火力资产达成机动指挥官预期效果。基于此逻辑,应将巡飞弹药视为陆军机动编队的新型火力支援资产。将其纳入整体火力计划,能在投入地面部队前摧毁/压制敌目标,显著提升指挥官任务完成能力。

本文旨在引发关于炮兵在巡飞弹药获取、规划与运用中角色的讨论。乌克兰经验为无人机融入现有陆军编制、协同现役火力平台提供多元思路。关键考量因素包括:无人机设计、通过防务制造商采购、以及陆军如何通过新条令实现全军机动部队列装。

炮兵兵种的引领使命
炮兵最适于领导全军机动部队巡飞弹药条令制定、研发与列装工作。如前所述,编配此类武器直接契合炮兵运用所有火力资产保障最大机动自由的使命。火力现代化是国防部未来十年核心计划,聚焦远程精确火力研发投入。在升级传统炮兵能力的同时,投资巡飞弹药作为营连级机动单元的建制火力与目标捕获能力,将为近距作战部队带来巨大火力优势。凭借与防务制造业的紧密联系,炮兵可主导设计采购低成本巡飞弹药系统。巡飞弹药与货架无人机技术已然成熟,关键在于评估设计方案,为陆军提供兼具灵活火力支援与机动目标达成能力的最佳武器系统。

系统设计与作战需求
各国武装力量存在多型功能各异的无人机与巡飞弹药。无人航空器(UAV)具备多速多高飞行能力,可搭载情报摄像头/传感器等特种载荷。美军机动营连级现主要列装"大鸦"与"美洲狮"UAV实施侦察目标定位。乌克兰战场巡飞弹药根据用途呈现类似多样性:部分大型弹药专攻远程重载荷投送(如乌军打击450公里外莫斯科目标),美军类似能力体现在空军MQ-9"死神"无人机(1,724公斤载荷)。但当前连级战场主流巡飞弹药体积更小,专为近距作战设计:
四旋翼型:持续监视目标区域,伺机投掷榴弹/迫击炮弹
固定翼型:携战斗部直撞目标引爆
陆军研发需确定最适配营连作战需求的构型。例如:可换装聚能装药弹摧毁装甲目标,或改配破片战斗部压制人员集群。此类弹药需成本可控、与现役UAV互操作,最终实现全军机动部队列装。

成本效益与编配路径
俄乌双方通过进口部件本土组装或整装进口获取巡飞弹药。价格因任务属性与载荷能力从数百至数十万美元不等。乌克兰指挥官向《华尔街日报》透露:"巡飞弹药成本约400美元,而传统间瞄弹药贵近10倍。即便需多枚弹药摧毁坦克(有时确需如此),仍物超所值"(Trofimov 2023)。以微成本瘫痪百万美元战车的能力,值得美军大规模编配。核心考量在于:陆军如何发展兼具精准打击、量产成本优势、抗干扰/反无人机能力,并能快速部署至全军机动营连的巡飞弹药体系。

图:2022年5月25日,美国海军陆战队一架Hero-400巡逻无人机在加利福尼亚州圣克莱门特岛飞行前进行准备

巡飞弹药的战场实践与编配考量
在乌克兰战场,连营级侦察无人机显著改变地面作战态势。短程无人机赋能机动单元精准掌握敌军位置与规模,同时用于召唤与校正对俄乌阵地的间瞄火力。乌军每日在基层机动单位使用此类武器,其作战效能已获验证。巡飞弹药常与侦察无人机协同作战——前者在营连责任区内捕捉打击目标的速度远超传统杀伤链间的间瞄火力系统。巡飞弹药的制导精度亦优于间瞄火力:操作员通过弹药搭载的实时摄像头目视修正航迹,实现近精确打击效果。这些武器赋予机动单元建制火力支援能力,为其提供直接火力保障。

营区内任何集结部队或预设阵地均可被巡飞弹药在数分钟内消灭。乌军将领近期坦言:"今日战场,坦克纵队或推进部队能在三到五分钟内被发现,再经三分钟即遭打击。战场机动生存窗口不超过10分钟"(Kullab 2023)。巡飞弹药为快节奏动态战场提供了独特优势:当其他武器系统无法响应时,仍可有效打击临时目标。营属迫击炮或炮兵连常受限于火力计划表,难以及时响应计划外打击需求;间瞄火力则因目标信息衰减导致毁伤效果不佳。具备快速转场能力的巡飞弹药可为营连责任区提供专属火力支柱,减轻其他火力单元负担。机动指挥官与火力支援人员需统筹弹药补给与目标分配,核心是建立巡飞弹药/迫击炮/身管火炮的可持续打击标准。

连营级巡飞弹药的指挥权归属亟待明确。机动指挥所与火力支援组(FiST)是合理选项:
火力支援组控制:利于将巡飞弹药纳入营旅级整体火力计划,确保各类火力资产(迫击炮/火炮/巡飞弹)协同打击计划/临时目标
机动指挥部控制:提升责任区内临时目标响应速度,但需额外协调上级火力单元避免重复打击
即便由机动指挥官直接控制(如同迫击炮资产),仍需通过FiST协调——防止火力浪费与重复打击。

巡飞弹药控制权变更将推动火力支援组结构调整。当前营连虽配有无人机操作员,但FiST或连指增设专职巡飞弹药操作员才能保障战场精准运用。建议在两层级组建无人机作战小组:配备专用载具、再装填与充电系统,可高效整合至FiST或连指框架。此编成同时确保后勤补给体系适配巡飞弹药特性。总体而言,优化巡飞弹药作战效能的关键在于建制设计——最大限度发挥其对机动单元的专属火力支援优势。

巡飞弹药的出现促使重新审视大规模作战环境下的火力架构。野战炮兵兵种可在系统研发、条令制定与编成革新中发挥核心作用:未来地面部队不仅要警戒山脊线敌情,更需防范空中威胁并伪装阵地规避巡飞弹药打击。启动巡飞弹药采购进程,方能确保机动部队为明日战场备齐火力支援体系。

参考文献

Army Doctrine Reference Publication 3-09

Kullab, S. (2023, September 26). Ukraine is building an advanced army of drones. for now, pilots improvise with duct tape and bombs. AP News. https://apnews.com/article/drones-ukraine-war-russia-innovation-technology-589f1fc0e0db007ea6d344b197207212

Tro mov, Y. (2023, September 29). Drones Everywhere: How the Technological Revolution on Ukraine Battle ields Is Reshaping Modern Warfare. The Wall Street Journal. https://www.wsj.com/world/drones-everywhere-how-the-technological-revolution-on-ukraine-battlefields-is-reshaping-modern-warfare-bf5d531b

参考来源:美国陆军

成为VIP会员查看完整内容
3

本书是对(深度)神经网络(NN)这一主题的入门介绍。神经网络是大语言模型、生成式人工智能以及众多其他应用的核心技术。由于“神经”这一术语带有较多的历史包袱,而神经网络本质上只是可微分算子的组合,因此在合适的上下文中,我更倾向于使用更为简洁的术语——“可微模型”来指代它们。 2009年,我几乎是偶然读到了一篇由 Yoshua Bengio 撰写的关于“深度”神经网络强大能力的论文 [Ben09],那时自动微分库如 Theano [ARAA+16] 正在变得流行。就像爱丽丝闯入了一个奇妙的编程国度——一个可微分的仙境,在那里,诸如选择一个元素这样看似简单的操作变得异常困难,而像识别猫这样原本复杂的任务却变得令人惊讶的简单。 过去十多年里,我一直在阅读、实现和讲授这类模型。本书是我尝试将这些年所学内容加以提炼的一个粗略总结,重点放在神经网络的设计及其最常见的组成部分上。鉴于该领域发展迅速,我力求在理论与代码、历史视角与最新趋势之间取得良好平衡。我假设读者具有一定的机器学习和线性代数基础,但在必要时也会涵盖相关的基础内容。

成为VIP会员查看完整内容
2

论文题目:CKnowEdit: A New Chinese Knowledge Editing Dataset for Linguistics, Facts, and Logic Error Correction in LLMs

本文作者:Jizhan Fang, Tianhe Lu, Yunzhi Yao, Ziyan Jiang, Xin Xu, Huajun Chen, Ningyu Zhang

发表会议:ACL 2025

论文链接:https://arxiv.org/abs/2409.05806

代码链接:https://zjunlp.github.io/project/CKnowEdit/

欢迎转载,转载请注明出处****

在当前大模型快速发展的背景下,模型固有知识的更新能力成为研究焦点。尽管已有大量知识编辑研究集中于英语及其维基百科语料,但中文作为具有深厚文化底蕴和复杂语言结构的语言系统,在知识编辑研究中仍显不足。 本文介绍发表于ACL 2025的研究成果——CKnowEdit,这是专为面向中文语言的的知识编辑数据集,涵盖中文语言的语言性、事实性与逻辑性错误一、背景与动机

当前主流的大语言模型(LLMs)由于其基于静态训练语料,缺乏显式知识结构,往往会产生幻觉(hallucination)、偏见、甚至不当输出。在面对中文语境时,模型能力瓶颈尤为明显,原因在于:

  1. 语言复杂性:中文字形、音、义结合紧密,语法灵活,诗词、成语等语言结构远超英文复杂度。
  2. 文化性事实:涉及特定历史、地理文化背景的信息难以用英语语料迁移。
  3. 逻辑结构差异:中文偏重话题优先、隐含连接词、上下文逻辑推理,常与英语基于谓语结构的逻辑体系不符。

**

**

二、数据集设计:三大类十子类

CKnowEdit数据类型 CKnowEdit从上述三个挑战出发,将知识错误划分为三大类,共十个子类,涵盖语言现象、事实知识与逻辑误判:

一、语言类(Linguistic)

  • 拼音(Pinyin):多音字歧义,如“六”读作“liù”与“lù”。
  • 古诗(Ancient Poetry):格律、用字精确,模型难以记忆。
  • 文言文(Classical Chinese):语义漂移严重,需上下文判断。
  • 成语(Idiom):字面与实际含义相悖,误解常见。
  • 谚语(Proverb):需隐喻理解,难以类比应用。

二、事实类(Fact)

  • 历史与地理知识:涉及特定中国历史事件、地理名词。

三、逻辑类(Logic)

  • 语音误解(Phonetic Misunderstand):多音字错解导致语义扭曲。
  • 推理错误(Reasoning Error):复杂多步推理中产生逻辑错判。
  • 文字游戏(Wordplay):词语歧义、分词错误导致歧解。

**

**

三、数据构建流程

CKnowEdit构建流程

  1. 数据收集:涵盖古典文学、网络论坛(如百度贴吧弱智吧)等多源文本,初步获取11,981条数据。
  2. 筛选机制:采用Qwen-7B-Chat模型,保留其回答错误的样本,提升数据挑战性。
  3. 标注流程
  • 正确答案由GPT-4生成,经人工校验。
  • 构建 泛化测试(Generalization)局部性测试(Locality) 字段,评估编辑后的知识是否具备迁移能力或是否干扰无关知识。
  1. 最终规模:共1,854条高质量编辑样本。

**

**

四、模型评估与实验结果

CKnowEdit实验主表

编辑方法

选用主流五种知识编辑方法(如AdaLoRA、ROME、AlphaEdit等),在四个主流中文大模型(Qwen、Qwen2、DeepSeek、Baichuan)上进行实验。

评估方式

摒弃token级评估,改用开放生成任务 + GPT-4o评分器的“LLM-as-a-judge”机制,评估维度包括:

  • 编辑成功率(Edit Success, ES)

  • 弱泛化能力(Generalization, Gen)

  • 强泛化能力(Portability, Por)

  • 局部性(Locality, Loc)

主要发现

  • AdaLoRA在各指标中表现最优,尤其在长文本生成任务中效果突出。
  • 对于语言类中的“古诗”“文言文”,所有模型与方法均表现不佳,说明当前模型对中文语言的记忆与理解仍存在显著短板。
  • 英文翻译无法替代中文原文,特别在语言与逻辑类任务上,翻译会导致信息丢失,编辑质量下降。

**

**

五、数据集价值与意义

CKnowEdit的提出具有如下意义:

  • 语言特性:为研究中文语义、语法、文化相关错误提供系统性资源。
  • 评估机制:结合人类评估与GPT-4o自动评分,具备高一致性。
  • 多维能力验证:支持泛化性与局部性测试,有助于发展稳健的知识编辑方法。

该数据集不仅能推动中文模型微调与校正,也为多语言知识编辑研究提供了对照样本。 六、开源信息

**

**

七、关于CKnowEdit的CCKS2025评测大赛

为了更好的研究中文编辑所存在的难点和困境,我们与CCKS协会联合阿里云天池平台共同举办了以CKnowEdit为赛题数据的大模型中文知识编辑大赛。

  • 比赛链接如下:CCKS2025知识编辑比赛
  • 本次比赛初赛复赛使用的数据集均为CKnowEdit,初赛为singleton edit设定,复赛为continues edit设定。

欢迎感兴趣的各位同学、老师或者是业界同行来参加我们的比赛,一起交流玩耍!


成为VIP会员查看完整内容
1

本书是对(深度)神经网络(NN)这一主题的入门介绍。神经网络是大语言模型、生成式人工智能以及众多其他应用的核心技术。由于“神经”这一术语带有较多的历史包袱,而神经网络本质上只是可微分算子的组合,因此在合适的上下文中,我更倾向于使用更为简洁的术语——“可微模型”来指代它们。

2009年,我几乎是偶然读到了一篇由 Yoshua Bengio 撰写的关于“深度”神经网络强大能力的论文 [Ben09],那时自动微分库如 Theano [ARAA+16] 正在变得流行。就像爱丽丝闯入了一个奇妙的编程国度——一个可微分的仙境,在那里,诸如选择一个元素这样看似简单的操作变得异常困难,而像识别猫这样原本复杂的任务却变得令人惊讶的简单。

过去十多年里,我一直在阅读、实现和讲授这类模型。本书是我尝试将这些年所学内容加以提炼的一个粗略总结,重点放在神经网络的设计及其最常见的组成部分上。鉴于该领域发展迅速,我力求在理论与代码、历史视角与最新趋势之间取得良好平衡。我假设读者具有一定的机器学习和线性代数基础,但在必要时也会涵盖相关的基础内容。

成为VIP会员查看完整内容
1

人工智能(AI)的发展将如何塑造未来战争形态?尽管公众对AI颠覆战争模式的潜力抱有浓厚兴趣,研究者们仍处于探索AI如何改变作战方式的初级阶段。本报告提供概念框架与初步评估,旨在为系统探讨AI改变军队作战制胜模式的潜力确立基础。

本次分析基于一项核心假设:AI成功实现其消除人类智力作为军事行动约束的目标。据此框架,报告评估了AI对军事行动四大"基础要素竞赛"的潜在影响。该框架将战争拆解为以下组元性竞争:(1)数量与质量的博弈,(2)隐蔽与发现的对抗,(3)集中式与分布式指挥控制(C2)的抉择,(4)网络进攻与网络防御的较量。针对每项要素,我们阐释了AI可能影响竞争形态的关键驱动因素与权衡取舍。

基于四维要素竞赛分析,我们认为美军可能需要改变其在作战理念与军力规划方面的传统模式,以释放AI潜能。鉴于AI技术尚未成熟,以下仅为试探性推论:

  • 数量可能相对质量取得显著优势。随着规模部署成本降低且能力提升,质量与数量的投资效价比将重新洗牌。自主技术与机器人学的进步或使大规模列装作战平台成为现实——这在过去是财力难以承受的。高端平台武器虽仍具价值,但作战中规模优势可能大幅增强。
  • 更精密的隐蔽手段或能抵消侦察技术进步,但这需要全新的欺骗战术与投入。若军队运用AI打造"战争迷雾生成器",通过先进诱饵群实施精密欺骗,隐蔽效果将远超当前水平。但此优势取决于隐蔽方试图隐藏的信息类型,以及侦察方利用AI传感器网络的能力。最终可能形成高度对抗的隐蔽-侦察博弈,优势地位将因具体情境而变动。AI与机器人诱饵对隐藏大国核力量尤其有效,从而降低AI颠覆战略稳定的风险。
  • "任务式指挥"——集中与分布式模式的混合体——仍将占据主导。优化C2的核心制约因素并非情报质量或决策速度,而是部队间通信链路的抗毁能力。
  • 防御方将受益于AI赋能,长期来看作战网络韧性将增强。关键在于AI能破解当前制约网络防御效能的规模与速度难题,扭转进攻方占优的局面。但网络进攻同样受益于AI,攻击方仍能在特定时空实施网络渗透。
  • 拒斥规模战术与欺骗手段的军队将面临严重劣势。依赖少量尖端兵力的模式正迅速由资产变为负担。传感网络与远程打击技术的进步要求军队将欺骗置于作战核心。实现这种转型需要美国国防生产与保障体系革新,包括构建能远距离保障更大规模部队的后勤体系。

彻底革新作战理念与部队架构的军队,将比仅用AI小幅改进现有模式的对手更具优势。释放AI军事潜能既是技术挑战更是组织变革,它要求军队突破既有的编制与运作舒适区。

  • 应立即投入规模战术与战争迷雾体系建设。即便AI技术尚未成熟,当前已可利用本报告揭示的趋势。应加强无人系统与先进诱饵等关键领域的实验投入。兵力规划需确保"高低混合"战略更侧重规模发展,新型高端系统须从设计阶段就融入欺骗与隐身方案而非事后追加。
  • 分配稀缺资源时需预设将遭遇精密自适应对手。尽管存在用AI强化既有模式以获取"先发优势"的诱惑,但更应准备应对优势转瞬即逝的局面,将资源投向能带来持久优势的领域。
  • 必须确保国防工业基础具备规模生产能力。当前工业界聚焦小批量高端装备,规模化生产乏力。转向规模导向的部队结构需重塑工业基础,此过程需充足时间与资源投入,应立即启动。

成为VIP会员查看完整内容
1

大型语言模型(LLMs)正迅速从被动的文本生成引擎演化为具备计划、记忆、调用外部工具以及彼此协作能力的智能体实体。本文以观点论文的形式探讨了此类LLM智能体(及其组成的社会)如何重塑推荐系统的设计空间。

我们提出了一套统一的形式化框架,该框架:(i)将单个智能体建模为一个由语言核心、工具集和分层记忆组成的元组;(ii)将多智能体推荐系统建模为一个由智能体集合、共享环境以及通信协议组成的三元组。在此框架下,我们展示了四个端到端的应用案例——互动派对策划、用于离线评估的合成用户模拟、多模态家具推荐,以及符合品牌调性的解释生成——每个案例都体现了由智能体编排所解锁的一项关键能力。 随后,我们提出了五大跨领域的挑战类别:协议复杂性、系统可扩展性、幻觉与错误传播、涌现的不一致性(包括隐蔽串通),以及品牌一致性问题。对于每一类挑战,我们均进行了问题形式化、初步缓解策略回顾,并指出了亟待解决的开放研究问题。

最终成果既是蓝图也是议程:蓝图展示了如何将具备记忆增强与工具使用能力的LLM智能体组装成稳健的推荐流程;议程则号召推荐系统(RecSys)社区开发新的基准、理论保障机制以及治理工具,以应对这类高度自主系统的快速演进。 通过将智能体抽象与推荐目标相融合,本文为构建新一代个性化、可信赖且具备丰富上下文感知能力的推荐服务奠定了基础。

1 引言与动机

大型语言模型(LLM)驱动的智能体不仅仅是传统意义上的聊天机器人,它们展现出智能体行为,而非仅通过基于 token 的预测来回应用户查询。本质上,它们被设计用于处理多步骤任务、编排信息流,并在必要时自主调用各种工具或功能【50, 54, 67】。这一点与传统聊天机器人形成了鲜明对比——后者可能仅在一次对话轮次中提供简短回答,而智能体系统则能够主动组织复杂问题并通过一系列有条理的步骤加以解决。换言之,LLM 智能体不仅是被动的对话伙伴,更是具备将任务分解并调用外部资源以达成目标的动态问题求解者【20, 25, 69】。 使用 LLM 智能体的一个根本原因在于现实任务的复杂性和多阶段性。面对旅行规划、多维度研究或迭代设计流程等复杂情境,单个静态提示往往无法满足需求。这些任务通常涉及多轮决策与外部数据交互,而智能体系统能够将复杂目标拆分为较小的子任务,并逐步加以解决。这种方法规避了传统文本查询的局限,使得决策过程更具鲁棒性和上下文感知能力,并更贴近人类的推理方式【52, 59】。此外,通过将“认知负担”分散到不同的组件中,智能体框架还能降低“幻觉”或回答不完整的风险,确保最终结果不再依赖单次 token 预测【26】。 记忆机制是 LLM 智能体中的关键组成部分,它确保与用户的对话随着时间推移保持一致性和个性化。与传统聊天机器人每轮对话独立、无法追踪历史内容不同,现代智能体结合了多种互补的记忆结构,每种记忆类型都针对不同目标进行优化(详见第3节): * 工作记忆(短期):帮助智能体回忆当前会话中的近期对话内容。例如,当用户提出“推荐一本悬疑小说”后紧接着说“像上次那本一样”,工作记忆会保留原始推荐内容,从而响应后续请求,而无需用户重复前述查询。 * 情节记忆(长期):记录具体的过去事件及其上下文与元数据。例如,一周前用户请求推荐意大利餐厅,如今提出“上次提到的那家餐厅”,情节记忆能准确检索出对应推荐,并回溯其提出时间与理由。 * 语义记忆(长期):从多次交互中提炼并积累通用事实或用户偏好。例如,经过多次对话,智能体可能推断出用户偏好意大利菜,即使在当前会话中未提及,也能主动将意式选项优先排序。 * 程序性记忆(长期):编码已习得的技能、流程或脚本,使智能体能高效地自动执行重复性任务。例如,若用户频繁请求“总结会议记录并发送邮件”,智能体可学会这一工作流;下次用户只需说“发送之前的总结”,即可自动完成任务。

综合运用这些不同类型的记忆,使得智能体始终掌握之前的步骤、用户偏好及外部知识,从而实现更流畅且具上下文感知的交互【18, 83】。 LLM 智能体的另一项核心优势在于其自主调用工具的能力,这极大增强了其处理复杂任务和提供专业信息的能力(见第2.1节)。这些智能体不仅依赖静态模型参数,还能主动调用专用模块或外部服务,以获取精确信息、执行特定分析或开展领域任务【23, 47】。例如,在推荐场景中,当用户请求推荐餐厅时,智能体可使用专业检索工具或数据库查询当前评分与可预订信息,而非依赖记忆中的旧数据。同样地,在推荐适配用户上传房间图像与风格偏好的家具时,智能体可能调用图像分析工具提取视觉特征,再检索产品数据库,筛选出符合审美与空间要求的商品(见第4节)。这些工具的使用也可与记忆机制相辅相成——如语义记忆(用户偏好、物品属性)与情节记忆(先前推荐记录)结合,从而提供更精确且具上下文关联性的推荐。最终,工具集成将 LLM 智能体的功能扩展到传统对话之外,使其具备更强的适应性与个性化处理能力。 综上所述——多步骤任务处理、记忆保持与工具调用——共同赋予 LLM 智能体超越传统问答式聊天机器人的自主能力。通过将任务拆解为可管理的组件【52】、保留关键上下文【38】、并在合适时调用外部工具【55】,LLM 智能体能提供更具思考性与整体性的解决方案,为对话系统与推荐系统带来更智能与灵活的变革。

成为VIP会员查看完整内容
1

报告核心要点前瞻

• 在即将发布的美国《国家防务战略》(NDS)中,唐纳德·特朗普第二届政府很可能重申:保卫美国本土——尤其是防范核威胁、网络威胁、天基威胁及其他战略威胁——是国防部(DoD)的首要职责,也是构建海外可信威慑力的基石。该战略可能将中国列为美国首要竞争对手,并认为需遏制中国不仅在印太地区、更在全球范围内的扩张态势。
• 美军必须推进部队结构、作战理念及联合作战条令的根本性变革,以期在人工智能与人机协同时代有效执行一体化多域联合兵种作战行动。
• 太空应被确立为独立的作战域,同时作为美国本土防御与力量投射的关键赋能领域,这要求加大对进攻性与防御性太空能力的投入。

构建应对全球威胁演变的美国防务体系

谁是美国最大的威胁——军方应如何应对?美国应在全球何处部署兵力?美军如何适应人工智能(AI)时代与太空武器化趋势?这些仅是下一版《国家防务战略》(NDS)应该解答的部分关键问题。作为新政府阐述防务愿景的纲领性文件,由国防部(DoD)发布的NDS确立指导美军力量建设、能力发展、全球态势、作战规划及资源分配的基本原则。特朗普第二届政府即将制定的NDS非同寻常:在战略竞争加剧、技术颠覆加速、全球威胁演变的背景下,它将定义未来四年国防部的防务态势、美军力量结构与现代化优先事项。2025年3月,国防部长皮特·赫格塞斯发布关于国家防务的机密级临时战略指导,昭示本届政府的初步防务重点。尽管该指导全文仍属机密,公开信息已为评估其方向并预判完整NDS核心主题提供坚实基础。本简报阐述国防部应在即将出台的NDS中解决的五大关键优先事项,提出实施考量要点,并指明为满足此决定性战略时代需求必须调整的领域。这些优先事项既承接临时战略指导,又由持久性战略现实所塑造。

##1. 美国本土

首先,《国家防务战略》(NDS)必须超越简单声明"本土防御是国防部(DoD)首要任务"的层面,并纠正以往战略的缺陷。这些缺陷包括未能明确区分防御与力量投射的优先级,以及过度聚焦核导弹与恐怖主义威胁。虽然历届政府NDS都将本土防御列为首要原则,但文件通常缺乏国防部如何协调该任务与其他优先事项的具体方案。即将出台的NDS将为厘清这一问题提供关键契机。

美国本土并非庇护所
过去二十年间,本土威胁态势已发生根本转变。9·11事件后威胁主要体现为本土恐怖袭击;如今,针对美国本土的潜在与现实威胁则是对手实施的强制性军事与非军事行动。同级别国家竞争者、跨国犯罪集团及恐怖组织可通过动能与非动能攻击向量威胁本土目标。俄罗斯等国或试图削弱美国作战制胜能力,甚至阻止美国介入国际事务——尤其是其协防盟国的能力。

本土防御:从前沿投射转向近域防护
传统上,历届政府采用分层防御理念:要求美军全球前沿投射力量,在威胁抵近本土前予以消灭。特朗普第二届政府的本土防御理念正转向聚焦管理本土面临的直接、邻近及内部威胁。当前政府更紧迫地关注本土与近岸威胁具备合理性——美国存在大量本土及近岸脆弱点,且对手正伺机利用。强有力的NDS需将这些问题置于核心位置:必须优先处理最严峻的脆弱性,并明确国防部与国土安全部(时而领导、时而支持州政府/民事机构/私营部门)的适当角色。

职责界定:本土防御与本土安全的区别
鉴于本土威胁丛生,需重新审视联邦机构的交叉但有别的职责。国防部在"本土防御"中的使命是"保护国家主权、领土、国内人口及关键防务基础设施免受外部威胁与侵略,或总统指明的其他威胁"。国土安全部(DHS)则领导全国力量:通过联邦紧急事务管理局(FEMA)协调反恐与应急响应;借助网络安全和基础设施安全局(CISA)降低网络/实体基础设施风险;管理边境人员与货物流通。国防部需协同DHS、司法部等民事与执法机构实施双向支援。

最紧迫的威胁
复杂外部威胁要求国防部采取更广泛、更主动的态势。国防部应在三大关键领域发挥主导或支持作用:
"导弹防御"(应对传统导弹威胁及高超声速/巡航导弹扩散);
"网络防御"(依托美国网络司令部(CYBERCOM)增强能力);
"关键基础设施防护"(抵御外国干涉与网络攻击等多元威胁)。
这些领域代表本土防御的真实前线,国防部应发挥独特能力支撑其他主管机构工作。

美国防部在边境安全中的角色
本届政府强调边境安全重要性,但必须警惕军民界限。NDS应直接考量"如何通过向民事当局提供防务支持(DSCA)机制适当介入",避免侵蚀公众对军队的信任。持续大规模部署南部边境将耗费高昂、冲击战备状态。国防部应考虑指定部分兵力(首选国民警卫队)专职此项任务,使专项部队训练DSCA能力,同时保障主力部队聚焦大国竞争中的杀伤力建设。

防空反导
除支援职能外,国防部必须主导本土防御核心任务,包括:发展防空反导体系以应对传统导弹威胁,并适应高超声速/巡航导弹扩散态势。强化北美航空航天防御司令部(NORAD)职能,投资新一代传感器与拦截器至关重要。

关键基础设施
国防部应深化跨机构协作,提升"防务关键基础设施"(DCIP)保护力、韧性及研发安全性。DCIP将其定义为"对美国安全具有重大影响的物理/虚拟系统和资产——其失效将严重削弱国家安全、经济安全、公共卫生或上述领域组合的防护能力"。根据《总统政策指令21号》(PPD-21),CISA负责维护16个关键部门的韧性。NDS框架下,国防部应重点防护对全球力量投射至关重要的自身及非国防部网络化资产(含军事设施、后勤供应链、通信系统、卫星基础设施、地面站等),同时关注金融系统、国防工业基地(DIB)生产设施等非常规资产。

网络防御
特朗普第一届政府提出的"前沿防御"(defend forward)理念以"威胁阻截于境外网络"为核心,但伴随国防部本土防御焦点转向"近域资产防护",CYBERCOM或需扩大其在防护本土关键防务基础设施的作用。CISA虽主导提升基础设施网络韧性,CYBERCOM应强化其管辖范围的关键防御基建保护职能。无论任务如何界定,都应增加CYBERCOM预算以支持"前沿狩猎(hunt forward)、前沿防御(defend forward)、持续介入"等任务,协同CISA保障国家关键基建安全。

太空基础设施
作为本土防御组成部分,五角大楼应优先强化本土太空地面站防护。控制卫星与接收遥测的地面站安保薄弱,易受干扰攻击。美军高度依赖卫星实施指挥控制、情报监视侦察(ISR)、全球力量投射及本土动能防御。太空军与太空司令部(SPACECOM)需协同联邦机构与商业伙伴,通过定向投资、威胁基准制定及联合演习,系统性提升地面站防护能力。

破坏与恶意干涉
国防部可通过情报支援等途径,协助开展反间谍行动的机构、预防基础设施破坏的执法部门、阻断恶意外国投资的监管部门。对民事部门及私营企业的支持对降低脆弱性(尤其是防务动员与政府持续运转系统)至关重要,需加强能源系统、港口、物流枢纽及国防工业基地的保护。

研究安全
承接国防科研的学术机构或实验室的安全漏洞构成重大威胁。开放研究环境与国际合作是科技进步基石,但保障联邦资助研究数据与知识产权免受外国窃取、干扰或破坏是关键。现行研究安全标准存在执行不一问题,国防部应协同能源部等机构推动高校伙伴:建立外国合作方/资助者审查机制;确保研究透明度与合规性;保护知识产权。这些措施需平衡开放创新与风险防控——避免对科研活动施加过度监控或限制。

2. 美国将不仅仅是区域性地而是全球性地与中国展开竞争

美国新版《国家防务战略》(NDS)或将更明确地将中国定位为美国首要竞争对手。这一优先排序标志着对特朗普首届政府与拜登政府战略的转变——尽管两届政府均强调大国竞争并将中国视为"步调威胁",但欧洲与中东持续危机稀释了对华优先关注,战略注意力分散。据赫格塞斯临时战略指导文件披露,新版NDS不仅将中国列为优先事项,更将定位为"美国首要竞争对手"。该战略可能推动根本性调整:将中国挑战置于与本土防御同等优先层级。除非这两大优先事项获得充分资源保障,其他领域必须接受次要地位。这代表从"平衡全球威胁"转向"解决最危险威胁"的思维转变,要求战略定力与资源管控。战略优先本属应有之义,但若国防部在缺乏匹配资源情况下被要求应对全域威胁,将导致风险承担未被清晰阐明。NDS可借机激活聚焦性对华战略:需重新校准美军力量结构与印太态势,并采取全球性(而非区域性)对华竞争路径。

对华竞争的全球视野
对华竞争讨论常局限于印太战区。尽管该区域仍是最可能军事冲突点,但中国与美国正展开全球竞争:从非洲港口基建到拉美稀土开采,再到加勒比地区军民两用航天设施投资,中国影响力网络已远超西太平洋。若仅聚焦印太,中国将在美方存在薄弱的区域实现战略侧翼包抄。

因此真正聚焦中国的NDS必须具备全球视野。这意味着所有作战司令部——不仅印太司令部(INDOPACOM)——可能将对华竞争纳入核心任务。南方司令部(SOUTHCOM)与非洲司令部(AFRICOM)在阻遏中国渗透西半球与非洲方面作用关键,这些区域的制度与关键基建正日益受中国影响。此类区域虽无需大规模常规驻军,但需持续存在、情报行动与伙伴关系建设——美国特种作战部队(SOF)、网络部队及跨机构协作在此类任务中可能会承担重要角色。特种作战司令部(SOCOM)与网络司令部(CYBERCOM)等功能性司令部可能会充分融入全球行动。这些力量能在"武装冲突门槛以下"展开竞争:实施灰色地带行动,在美军常规存在有限区域塑造战略环境。从训练伙伴、情报收集到反制信息战,特种部队为全球竞争提供高性价比工具。

力量结构与态势调整
对华聚焦防务战略可能会重塑美军结构与部署。力量结构方面,五角大楼应优先发展增强印太威慑与作战能力:远程火力、生存型打击平台、分布式后勤及基础设施防护。投资重点倾向具备广域强对抗环境作战能力的系统,如B-21轰炸机、弗吉尼亚级潜艇、无人系统及天基ISR。关键的是,这些能力具备跨战区通用性:远程资产机动性使其可快速投送他区,赋予美军全球响应能力。力量态势需同步调整:美国应强化印太前沿部署力量——特别在第一、第二岛链——通过确保菲律宾、日本、澳大利亚及马里亚纳群岛关键区域基地权与设施扩建。此举不仅关乎威慑,更为冲突时危机响应与快速增援奠定基础。但态势调整需全球统筹:从欧中东撤出资产需配套可信风险缓释方案(如责任分担、盟国轮驻、伙伴能力建设)。

全球风险管理
成功实施对华优先战略需辅以现实风险评估:明确哪些能力、任务与区域可降级而不损美国利益。例如,为传统冲突优化的重型装甲集群与短程战术机队,若对印太作战或全球力量投射无实质贡献则应重新评估。国防部或许会阐明在次要战区的行动边界,使盟友能相应规划并承担更多责任。美国不会完全退出欧中东,可能从提供作战规模转向提供赋能盟友主导的"利基能力":欧洲盟友应分担区域威慑责任,海湾伙伴需投资自主应对地区威胁能力。美国在这些战区的战略再优先应体现为"保持影响力与安全存在而不承担全作战负荷"。最后,对华聚焦战略可能考量中国与俄伊朝等势力日益强化的战略协作——其联动正巩固其战略地位。美国防部或将此纳入优先框架:评估与这些行为体竞争如何与对华目标交织,并相应协调盟友、伙伴及跨机构行动。

3. 适应人工智能与自主系统时代的诸兵种合成作战

即将发布的《国家防务战略》(NDS)必须采纳革新的诸兵种合成作战方案——既要利用人工智能(AI)与自主系统优势,又不预设其在所有作战场景普遍适用或完全替代传统方式。为有效执行联合全域作战(JADO),国防部需打造能在对抗环境中实施火力打击与机动的一体化联合部队。这要求精心设计高低端能力组合(含AI与自主技术),确保部队在各战区与场景保持适应性——人类决策、传统系统或简易平台仍可能提供决定性优势。

自2022年发布上版NDS以来,AI与自主系统取得重大进展:2022年末ChatGPT的推出迅速提升生成式AI的公众认知度;俄乌战场上双方发展自主遥控系统获取优势(部分高危任务实现人机协同或替代人员操作);以色列运用AI强化情报处理、战场通信与对哈马斯监控。这些进展深刻影响从后勤监视到直接交战的各作战域,迫使美国及其对手重新考量未来战争形态。新版NDS必须明确三大方向:国防部对未来战争的构想、新技术相对传统平台的投入优先级、AI时代诸兵种合成作战的组织与实施。传统合成作战依赖步兵/装甲/炮兵/航空兵等兵种协同打击敌方弱点;新兴作战环境下,全域无人系统与机器速度决策工具将日益融入作战体系。

空中领域实证
自主性与AI将渗透陆海空天水下各域。以空域为例:乌克兰战场无人机系统(UAS)已颠覆前线作战模式,打破传统力量结构假设——俄乌双方使用UAS实施情报监视侦察(ISR)、目标锁定与精确打击,其作战半径常超越传统直瞄武器。这种纵深打击能力已改变战术战役规划框架。UAS还显著降低制空权门槛:低成本商用无人机的普及使国家与非国家行为体能以微小投入争夺"空域近海"控制权,迫使军队重新整合高端有人平台(如F-35战斗机)与无人机体系。同时各域防御系统均需适应探测、追踪与反制敌方UAS的新挑战。

资产分类体系革新
廉价无人系统的出现重塑美军资产耗损性与生存性概念。传统军事规划将资产分为两类:弹药(可耗损)与高价值平台(需保全)。UAS的普及催生四级分类体系:

  1. 可耗损资产:一次性使用常规弹药(如炮弹)
  2. 可承受损失资产:低成本平台(如商用改装无人机,损失战略影响甚微)
  3. 风险耐受资产:中等价值无人系统(如"弹簧刀600"巡飞弹,指挥官倾向保留但可接受损失)
  4. 高生存性资产:需重点保护的高价值平台或人员(如航空母舰、F-35飞行员)
    该框架赋予指挥官更灵活的风险管理空间,避免陷入"孤注一掷或放弃行动"的极端抉择。

能力建设与采购战略
国防部必须据此明确未来作战所需能力、合理高低端组合及系统采购淘汰策略。印太冲突迥异于乌克兰战场:广域拒止环境下的力量投射与持续保障挑战倍增,空海域作战地位凸显。NDS应规划融合低成本自主系统(如"郊狼"拦截弹)与高端平台(如B-21轰炸机)的互补优势方案。当前美军既缺优化力量编成,亦乏运用该能力组合击败大国的作战概念。国防部需:

  • 加速列装经济型自主系统(2025年前部署"自主蜂群"项目)
  • 制定高低端资产协同运用的作战条令(如有人舰艇指挥无人艇群)
  • 改革采办流程(缩短"概念-部署"周期至18个月)
  • 强化国防工业基础以加速关键系统投产(提升弹药年产至10万枚)

高低端能力组合本质是非对称平衡:少量高端有人平台(如弗吉尼亚级潜艇)指挥大规模低成本自主/可耗损系统集群(如"海上猎人"无人艇)实施火力机动。军种发展新一代平台武器时,该理念应贯穿平台设计、武器研发与整体力量建设。

诸兵种合成变革路径
国防部核心挑战不仅是获取技术,更需将其融入一体化作战概念与力量结构:

  1. 人机协同常态化:飞行员/步兵/舰员需与"忠诚僚机"无人机、无人战车系统协同作战
  2. 技术瓶颈突破:破解数据链互操作性、AI决策可信度保障(如符合MIL-STD-882E标准)
  3. 投资平衡策略:60%预算投入前沿系统(高超音速武器)、40%维持传统威慑战力(航母打击群)
  4. 机制创新:通过"采办快速通道"、强化试验鉴定(年增50%AI测试场景)、加速作战实验周期(6个月/轮)推动技术整合

战略关键点在于:确保自主系统增强而非取代现有体系(如AI辅助飞行员决策),规避形成脆弱依赖链(如避免卫星导航单点失效)。

4. 将太空作为战略赋能域优先发展

即将发布的《国家防务战略》(NDS)很可能大幅提升太空的战略优先级——以体现其作为美国本土防御及全球军事行动的战略赋能作用。二十世纪制空权决定战场优势;二十一世纪则将由制天权主导冲突制胜。因此美国必须:
• 剥夺大国对手战时利用太空实施恶意行动或谋取军事优势的能力
• 确保美国及盟友在太空域内、穿越太空域及依赖太空保障的军事行动自由
太空不仅是支援域,更是支撑现代战争与威慑所有要素的作战域。然而其核心地位尚未匹配资源投入——最新佐证是《2026财年总统预算申请案》未能满足维持美国太空霸权或应对新兴威胁的需求。

为此应该大幅增加美国太空军(USSF)与太空司令部(SPACECOM)预算。这些机构:保障太空域安全;确保美军有效实施全域(空中/陆地/海洋/网络)作战。若丧失可靠的太空能力,美军全球力量投射效能将遭重创——尤其在印太地区。

太空威胁态势升级
威胁环境印证该优先级的必要性:中俄正加速发展军用及军民两用太空能力,重点部署旨在威慑美国军事介入、或在危机冲突中拒止/削弱美军太空能力的反太空系统,包括电子战系统、干扰器、网络攻击、直接上升与共轨反卫星武器。中俄的核心目标是利用美军对太空系统的深度依赖——包括情报监视侦察(ISR)、远程精确打击协调、全球通信、定位导航授时(PNT)、导弹预警及核指挥控制通信(NC3)。这种依赖性更延伸至美国经济、基础设施与民生领域。

印太战略的太空支点
对华聚焦战略要求特别关注太空对抗域特性。印太战区的广域特性要求美军协调多国联合行动,太空系统可提供持续态势感知、早期导弹预警、弹性安全通信及精确目标锁定。美军规划者应预判:任何对华冲突初期,中国都将试图摧毁美国卫星星座以"致盲"美军——破坏关键ISR与通信系统迟滞美军快速反应。此类攻击将扩大中国在此战区的行动自由(时间/精度/覆盖范围具决定性)。

与此同时,中国自身对太空的依赖(导弹预警、中段反导及兵力协调)正形成可被利用的弱点。太空已成为中国军事力量及其"威慑-胁迫-国力"战略的三大支柱。在此背景下,太空军与太空司令部必须优先发展攻防能力:保障美国太空行动自由、保护关键资产、剥夺中国太空军事优势。这要求确保天基ISR/通信/目标锁定能力,同时保留在冲突中破坏中国太空依赖行动的手段。

NDS框架下的太空优先策略
新版NDS需确认太空不仅是支援域——更是支撑联合作战各维度的对抗性作战环境。从通信导航到导弹预警情报搜集,天基系统构成威慑力、战斗力与日常战备的基石。为真正提升太空优先级,国防部必须:
显著增加快速发射与卫星补网能力投资(确保受袭后的体系弹性);
深化与商业航天部门合作(吸纳私营领域创新力与敏捷性);
构建军民混合太空架构(整合私营航天能力);
发展反卫星威胁应对手段(含天基反导系统与先进电子战能力)。

忽视太空优先级将危及NDS两大核心目标——本土防御与对华威慑。若无法保障美国太空行动自由,中俄将塑造有利于其的太空秩序——威胁美国国家安全、经济稳定及威慑可信度——使国家在高强度冲突中的制胜能力面临重大风险。太空或成未来战争的首发战场,NDS必须以匹配的战略、资源与作战聚焦回应这一现实。

5. 威慑针对本土的战略攻击

为实现新版《国家防务战略》(NDS)的核心目标(保卫本土与威慑中国扩张),美国必须重新聚焦应对本土遭战略攻击的风险。威慑此类攻击具有双重必要性:若威慑失败,则需以最低损失恢复威慑态势(符合可接受的政治军事结果)。首先,战略攻击风险使对手可能胁迫美国放弃支持盟友伙伴,或通过军事打击削弱美国持续支援能力——直接破坏对华威慑目标。其次,对手能通过战略攻击使美国代价远超其全球防务外交政策潜在收益,进而威胁本土安全本身。因此NDS应优先制定威慑与降低本土战略攻击风险的计划,聚焦五大相互支撑的支柱。

威慑针对本土的大规模核攻击
首要任务是可信威慑针对本土的大规模核攻击(国家行为体构成的唯一生存性威胁)。这要求:具备生存型核二次打击能力、现代化核指挥控制通信(NC3)体系、强健的政府延续机制。现有威慑态势关键要素仍不可或缺——确保无单一投送系统成为单点失效源;避免依赖需在遭袭时发射以免摧毁的能力。完成现役核三位一体及NC3现代化项目至关重要。

防止区域冲突中的核升级
其次须防止区域常规冲突核升级。一旦核武器投入使用(即使有限规模),即存失控升级的高风险。降低此风险要求美军战略确保对手无法通过核使用获取明确优势路径。这需要:前沿部署可信的战区核选项;牢固且有约束力的联盟承诺;具备核降级环境作战能力的常规部队;挫败对手有限核选项的能力;可限制对手核胁迫信心的战略毁伤限制系统。此外美军作战计划与概念应尽可能避免威胁可能引发对手"政权颠覆"或"生存性失败"恐惧的目标类型,从而降低其首先使用核武的动机。

延伸威慑
上述措施共同支撑延伸威慑目标——将核与非核战略攻击威慑扩展至盟友伙伴,并确保其信任美国威慑力。这种延伸威慑符合临时防务指导的另一目标:增加盟友责任分担。若盟友伙伴遭受核胁迫却无力抵抗,更可能妥协对手并拒绝支持美联军行动。赋能盟友抵抗核胁迫可使其作为关键伙伴持续参与作战。反之,若未能向面临生存威胁的盟友提供延伸威慑,或促使这些国家发展核武器——既违背美国外交政策核心原则,更将加剧全球核风险。

避免过度依赖常规威慑
第三,美国与盟友须部署足以威慑大国常规战争的常规力量,同时不损害支撑升级控制的核威慑。常规威慑历来存缺陷:大国曾在常规劣势下发动战争。若对手恐惧政权崩溃,美军常规胜利或反促其升级至核使用。缺乏充分核威慑支撑的过度常规化力量,将诱使对手将核升级视为合理应对。灵活可信的核选项仍不可或缺:既威慑升级,又在特定场景(如同时应对多区域冲突)抵消美军常规劣势。

威慑非核高后果战略攻击
第四,美国需保持灵活宣示政策并部署适应型战略力量,以威慑针对本土的非核高后果战略攻击,包括:
• 生物攻击(如释放基因工程病原体)
• 瘫痪美国经济系统的网络打击
• 针对核力量或NC3基础设施的大规模精确常规打击
美国姿态应保留核报复阈值的模糊性,同时保持对此类攻击的快速可靠溯源能力——此为可信威慑必要条件。

构建抗战略攻击的本土韧性
第五,美国必须增强承受战略攻击并恢复的能力。作战能力韧性、政府延续性、社会功能存续及国家意志维系,对限制毁伤效果、粉碎对手"攻击可瓦解美国战略"的幻想至关重要。

NDS中本土威慑优先性的要义
威慑针对本土的大规模核攻击仍是国家安全基石——此类攻击足以摧毁美国社会运行基础。但现代威慑要求更趋复杂:不仅需要安全核力量与指挥体系,更需战区核选项、可信毁伤限制防御、升级管控工具及本土韧性措施。若新版NDS未能充分优先此任务,将留下中俄等对手可乘之险——最终使本土防御与海外威慑能力同陷不可承受之风险。

结论

美国防部即将发布新版《国家防务战略》(NDS)。未来挑战——包括对华战略竞争加剧、技术变革加速及新兴冲突域涌现——要求制定清晰、聚焦且前瞻性的战略。本简报阐明应纳入NDS的五大核心优先事项:

  1. 保卫本土:应对全域战略威胁并强化本土韧性
  2. 全球性对华优先:超越区域视角实施全域对华竞争
  3. 智能化诸兵种合成:发展AI与自主系统时代的联合全域作战能力
  4. 太空战略赋能:提升太空域投资并确保行动自由
  5. 战略攻击威慑:构建现代化韧性威慑体系
成为VIP会员查看完整内容
4

为联合打击战斗机(JSF)升级、区域打击飞机、新一代远程打击飞机及先进无人航空系统(UAS)所设计的涡轮发动机,大幅突破了单位质量流量的涡轮功与涡轮入口温度极限。因此未来涡轮将给气动设计与耐久性设计带来重大挑战。与此同时,所有政府承包商在上述领域采用的尖端预测工具均存在技术缺陷。为避免未来设计偏差,亟需提升计算工具的预测能力,并尽可能快速严谨地研究先进涡轮机械的流场特征。据此启动本研究计划:该计划完美整合了强大的分析(即建模与仿真)、设计与实验三大模块,以实现核心目标。本项目获取的数据与开发的方法可用于定义先进涡轮概念/构型,并为所有主要发动机制造商、政府研究实验室及高校执行详细的设计与分析系统验证。

本计划现有及规划的研究平台支持技术成熟度(TRL)1至5级的多样化实验,同时允许研究涉及现役及未来涡轮机械系统的广泛工况与参数。因此研究成果可支撑已列装系统、当前开发系统及处于早期研发阶段的未来系统。此外,由于本计划产生的概念不受专有数据权限限制,多数涡轮构型预计将推动全美燃气轮机行业的技术发展,且此趋势将在未来数年持续加速。

本计划《新一代涡轮气动热力学研究》定制化整合建模仿真、设计与实验模块,确保推进技术从TRL=1到TRL=5的严格演进路径: 第一阶段
基础研究与概念开发通过创新涡轮构型设计实施:利用自主研发分析工具,在热流仪表实验室(HFIL)、传热与气动实验室(HAL)研发风洞及低速风洞设施(LSWTF)测试先进概念。这些研发工具实现TRL=1至TRL=3的技术转化。

第二阶段
利用传热与气动热力实验室(HAL)的涡轮跨声速叶栅(TTC)及先进冷却装置(ACF),验证内部技术与承包商技术的TRL=4成熟度。

第三阶段
在涡轮研究设施(TRF)完成内部与承包商技术的TRL=5验证。涡轮设计与分析系统(TDAAS)提供的自主研发分析工具贯穿所有研发活动,通过实验指导与补充证明TRL=1至5的技术成熟度。该工具同时支撑TRL=6验证机设计开发及试验后数据分析。

项目核心在于美国空军研究实验室推进部件分部(AFRL/RQTT)多年研发的全系列高压/低压涡轮构型开发与测试。根据美国空军科学咨询委员会建议及涡轮机械非定常流动Minnowbrook会议行业顾问组意见,所有涡轮研究构型归属政府,相关数据与预测成果在美国政府承包商间共享。由此AFRL/RQTT推动全美燃气轮机行业提升基于物理机制的设计体系。

本计划进一步遵循《美国空军2030科技战略》宗旨推动涡轮研究部件发展。首批成果包括涡轮耐久性研究需求详勘以及基于实验与计算数据开发现物理模型的机制研究。前者总结联合技术研究中心(UTRC)耐久性设计工具研讨会成果,最终促成NASA格伦研究中心(GRC)参与撰写的技术报告[1]及后续快速高精度耐久性分析方法开发计划[2];后者形成量纲分析可行性研究的技术报告[3]与会议论文[4]。在基础研究后开展的涡轮设计、建模与分析项目,定义了具有超高举升力和高功特性的低压涡轮(LPT)级。随后与霍尼韦尔宇航公司启动合作研发协议(20-114-RQ01CRADA),将高压举升、高功低压涡轮(LPT)技术从政府向产业转化。

此外两项专项协议研究流场控制方法,以补充AFRL/RQTT的LPT设计成果:与加拿大皇家军事学院签署的专项协议(PA # CA-US-2022-0001)研究基于生物机制的被动流控方法(尤其借鉴座头鲸胸鳍结节结构);与以色列理工学院签署的专项协议(PA:飞行器技术)研究非定常喷流与声激励主动流控技术。研究成果汇总于技术报告[5]并发表为会议论文与期刊文章[6]。主要研究发现概述如下,完整研究参见政府[1,2,3,5]与公共数据库[4,6]的参考文献。

成为VIP会员查看完整内容
2
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员