过去三年间,多国海军经历了近数十年来最激烈的海上冲突。2022年2月爆发的俄乌战争,以及2023年11月也门胡塞武装对红海航运的袭击,为技术进步对海军作战的影响提供了现实例证。相关经验教训可能对未来数年的舰队结构、装备发展与作战条令产生深远影响。然而,当前冲突的独特性警示我们不宜过度泛化其启示意义。
尽管相关冲突方的战略目标存在差异,黑海与红海的海上对抗仍呈现显著共性。两场冲突均发生于相对封闭的近岸海域,地理环境对海军威胁构成产生决定性影响。俄黑海舰队与红海盟军舰队均在敌对海岸附近活动,面临阻挠其达成目标的军事力量。俄海军虽初期取得有限战果,但未能实现战略目标——乌克兰至关重要的粮食贸易至今仍基本畅通。与此同时,尽管美国海军及其盟友在保障红海航运咽喉要道的战术层面取得成功,却未能阻止航运中断带来的实质性经济损失(尽管目前影响尚属有限)。总体而言,这些案例既验证了冷战后期海军发展聚焦近岸作战的合理性,也暴露出该战略的潜在局限。
图:2019年4月乌克兰R-360海王星反舰导弹原型试射。黑海与红海作战均面临强大陆基导弹威胁。[乌克兰总统办公室]
两场冲突的显著特征还体现于海军力量的非对称性。俄全面行动后,乌克兰有限舰队迅速丧失作战能力,至今未能部署主要水面战斗舰艇。同样,也门胡塞武装从未建立成规模的海军力量。因此,俄黑海舰队与美海军盟军均未遭遇传统海军对抗,作战核心在于应对日益多样化的陆基导弹威胁(辅以无人机技术升级)。在缺乏"源头消除"(通过占领或摧毁敌方基础设施)有效手段的情况下,此类威胁的遏制始终面临严峻挑战。
黑海与红海冲突标志着无人系统在海战中进入成熟应用阶段。无人机此前已在特定海军作战领域产生实质影响,如2003年伊拉克战争中的扫雷行动。但在当前战争中,其应用范围显著扩大。乌克兰使用国产“马古拉V5”等无人水面艇(USV),在港口与海上摧毁多艘俄军舰艇的案例引发高度关注。这种低成本USV的快速部署能力及目标锁定难题的突破,无疑是重大战术成就。尽管航程与航速有限,此类装备在协同攻击或蜂群作战中展现出优异的隐蔽性与反制难度。
除直接作为武器平台外,无人机在更广泛的协同作战中日益成为干扰与饱和舰艇防御体系的关键要素。未经证实的多方报道指出,乌克兰曾在2022年4月俄巡洋舰"莫斯科"号遭海王星反舰导弹击沉前,使用无人机分散舰上战斗管理团队注意力。红海战场上,胡塞武装对盟军舰艇的袭击也常采用无人机与巡航导弹、弹道导弹的协同攻击模式。例如2024年1月初的复杂交战中,美英舰艇与舰载机协同拦截了18架单向攻击(OWA)无人机、2枚巡航导弹与1枚弹道导弹。尽管此类战术迄今未能对舰艇造成实质损伤,但仍给兵力分散的盟军带来人员疲劳与弹药消耗的严峻挑战。更需警惕的是,若技术更先进、资源更充足的对手采用类似战术,可能产生更具破坏性的战果。
图为2022年10月14日波兰境内的Flyeye 3.0无人机。大量可消耗型无人机的普及正彻底改变近海水域持续ISR情报获取模式。[美国陆军/Andrew Greenwood中士]
无人机在黑海冲突中另一个较少被论及的作用,是各类无人机平台提供的持续海上情报、监视与侦察(ISR)支持。如同陆战场态势,配备商用技术的可消耗型无人机大规模应用,极大提升了近岸水域实时情报获取能力。这种情报优势无疑助推了乌克兰此前取得的若干战果。无论如何,无人机带来的信息优势扩张,已成为任何试图在对手近海施加影响力的海军面临的新挑战。
应对海上无人机威胁的解决方案仍处于发展阶段。部分案例显示传统手段经改造可有效应对新威胁,如俄海军运用直升机探测与打击USV,充分发挥空中反制优势——这种思路令人联想起冷战时期针对导弹快艇威胁的旋翼机战术革新。而在近海作战中,广泛使用侦察无人机带来的情报优势可能更难被抵消,但视觉隐身技术与电子辐射管控仍将是关键应对手段。
近期黑海与红海军事行动中,后勤要素的影响程度呈现出耐人寻味(虽非全然意外)的特征。最具警示意义的案例莫过于俄黑海舰队(BSF)母港塞瓦斯托波尔在密集防空体系下,仍遭受无人机与风暴阴影巡航导弹等精确制导武器的有效打击。舰艇与港口设施的严重损毁极大削弱了该基地的作战功能,迫使俄舰队舰艇分散部署,进而制约整体作战效能。这一实例深刻揭示了敌方火力范围内固定基础设施的防护局限性,对远征与防御性海军行动均具重要启示。潜在应对策略包括借鉴美国海军分布式海上作战(DMO)理念强化兵力分散部署,以及提升机动基地设施的运用比重。
图为俄775型"蟾蜍"级登陆舰加里宁格勒号与英国登陆艇联合演练历史画面(摄于和平时期)。黑海作战表明后勤支援舰船在新技术面前异常脆弱。[英国王室版权2008]
黑海战事进一步揭示,至少近海环境中,后勤支援船队对新兴技术的防御存在显著短板。乌克兰通过导弹与无人机协同攻击,摧毁俄黑海舰队多艘登陆舰与支援舰,重创其后勤保障体系。这迫使俄军更多依赖民用船舶与刻赤海峡大桥等陆基设施实施后勤补给,而这些替代方案本身也存在脆弱性。西方国家后勤舰船(多数武备薄弱)在类似冲突中同样面临高风险。这对前述DMO战略构成特殊挑战——分布式部署部队对后勤保障(尤其是燃油补给)的需求更为迫切。
红海防御胡塞武装袭击的作战同样凸显后勤影响。广泛报道显示,部署该区域舰艇的先进防空导弹库存因持续拦截任务快速消耗。例如英国海军钻石号驱逐舰在两个月高强度执勤后,于2024年2月耗时5,556公里(3,000海里)航渡至直布罗陀补充海蝰蛇/紫苑防空导弹(最大载弹量48枚)。核心挑战并非单次攻击突破防御,而在于持续消耗最终导致弹药储备枯竭。
应对方案呈现多元化发展趋势。水面战舰导弹容量扩展趋势显著:英国45型驱逐舰升级计划中,钻石号将为其海拦截导弹系统加装24枚CAMM防空导弹。美国海军运用舰载航空兵协同舰基导弹构建防空伞的实践也成效显著,体现了美海军协同交战能力(CEC)引领的舰队级武器-传感器融合价值。
图:2023年10月19日红海作战期间,阿利·伯克级驱逐舰卡尼号(DDG-64)战斗情报中心实况。红海行动验证了北约舰艇防空系统效能,但也暴露关键问题。[美国海军]
昂贵防空导弹与廉价威胁弹药间的成本失衡现象,推动定向能武器(DEW)如高能激光器(HEL)成为投资热点。此类武器具备"无限弹药库"潜力,单次交战成本仅需数美元电力消耗,为未来防御体系提供革命性解决方案。
黑海与红海近期军事行动为训练与战备领域提供了重要经验。由于显而易见的原因,俄乌战争初期俄黑海舰队(BSF)战备状况缺乏一手资料。但"莫斯科"号巡洋舰沉没后,美欧分析指出态势感知缺陷与损管流程不足(士官队伍结构失衡与过度依赖短期义务兵役人员)是导致该舰损失的核心因素。俄黑海舰队在战争期间持续承受较高战损,表明俄海军需时适应作战现实。
红海盟军舰队迄今避免了重大损失,但作战经历并非一帆风顺。丹麦防空护卫舰伊万·休特菲尔德号(KDM Iver Huitfeldt)的提前撤离提供了警示案例——该舰虽在2024年3月成功拦截无人机攻击,但暴露出装备与人员训练的诸多缺陷:改进型海麻雀导弹(ESSM)发射器故障导致暂时无法使用;76毫米舰炮发射的半数弹药过早引爆;指挥控制系统(C2)操作失误。值得注意的是,该舰部署前已存在关于人员经验、训练水平及部分装备可靠性的担忧。
图为2018年在波罗的海活动的丹麦皇家海军伊万·休特菲尔德号护卫舰。该舰红海部署暴露出装备与人员训练缺陷。[美国海军]
此类问题根源可追溯至和平环境滋生的自满情绪,以及冷战后初期能力空心化的长期影响。随着东西方紧张局势升级带来的战备强化趋势,或将缓解部分积弊。值得注意的是,近年来保持较高作战节奏的海军(如美国海军与英国皇家海军)在适应战时环境过程中,相比低活跃度同行展现出更强的系统稳定性。
近期冲突中一个鲜被讨论却颇具启示的现象,是现代主力水面舰艇展现的优异生存能力。除过时且准备不足的"莫斯科"号外,作战中未有其他主力水面战斗舰艇被摧毁。相比之下,俄黑海舰队损失的多为小型战斗舰艇与后勤支援船(如前所述)。大型战舰在持续作战中展现的生存能力,对"低成本小型舰优先"的舰队结构理论构成了现实挑战。
本文探讨的近期海军行动为从业者与工业界提供了诸多重要启示,但其可借鉴范围存在客观限制。如前所述,两场冲突的海上要素均发生于陆基系统占据显著优势的近岸水域。俄黑海舰队舰艇在狭窄水域持续处于各类导弹、无人机及其他武器的打击范围内,承受重大战损实属必然。同理,红海盟军舰队护卫航运的作战区域限于陆基武器覆盖的咽喉要道,其威胁消除能力受制于现实与政治因素。这些经验对地理环境迥异的作战场景适用性有限。近岸环境中无人机提供的持续ISR优势将随作战海域扩展而递减;黑海等封闭水域的无人艇蜂群战术在开阔水域亦难奏效——其航程、航速与适航性短板将暴露无遗。
同等重要的是,本文研究的两场行动均呈现显著的非对称特征,对双方均具备强大海军实力的冲突借鉴意义有限。黑海与红海战场均未发生水面舰艇对抗,黑海潜艇作战也仅限于俄"基洛"级潜艇发射"口径"巡航导弹实施远程对陆打击。尽管俄黑海舰队两栖舰艇在侵乌前大幅加强,但未实施成规模两栖登陆行动。因此,两场冲突遗留诸多关于未来海军作战方向的未解课题。
俄乌战争与红海航运保护行动为分析海军技术及条令演进的实战影响提供了重要契机。这些战事揭示了在武装对手控制的近海水域实施持久作战的固有挑战,可消耗型无人机普及带来的ISR优势与饱和攻击潜力进一步加剧了作战难度。训练与战备的重要性(特别是平战转换能力)再次得到验证。然而,独特的地理条件与力量非对称性必然限制其经验对其他海战场景的适用性。例如,研究太平洋广阔水域潜在"蓝水"冲突的学者仍需寻求其他案例支撑。
参考来源:欧洲安防杂志
随着工作边界的扩展与未来形态的演进,人类与机器将共享更具协作性的工作空间,实现成员间的自由协同。在此背景下,需明确信息在团队成员间的流通机制,以确保人机信息交互的高效性与准确性。共享态势感知(SSA)——即个体获取并解析非自身信息源信息的程度——为构建上述信息交换的设计准则提供了有效框架。本研究提出增强/虚拟现实(AR/VR)环境下共享态势感知的初步设计原则,旨在帮助设计者:(1)基于基础原则构建高效界面;(2)通过系统性文献综述开发的测量工具评估候选界面设计效能。研究目标通过以下专项实验达成:1) 论证AR支持任务中SSA的重要性;2) 阐述支撑SSA所需的设计指南与测量工具;3) 采用SSA衍生的AR界面开展用户研究,验证文献提炼准则的有效性。
本文通过互补性章节深入解析SSA构成要素及相关设计准则,探讨SSA与AR/VR系统信号检测的关联性,以及用户与界面SSA测量对目标成果的促进作用。最终章节整合各章研究成果,系统回应本论文的核心研究问题与目标。
第二章论述初始用户研究,通过合作搜索任务分析人类绩效,初步识别SSA信息在同类任务中的效用价值。非SSA导向的界面设计缺陷分析为SSA初步准则的提炼提供了启示。本章同时介绍一种辅助测量工具,该工具虽作为人类SSA间接度量指标开发,亦可作为AR/VR头显设备的通用可用性评估或生物力学测量工具。
第三章开发AR/VR头戴式显示器(HWD)角急动度测量指标,使设计者能基于特定AR界面评估用户运动质量。该指标既可识别界面用户需求特征,也可作为AR/VR普适化进程中疲劳度与损伤风险的量化依据。延续此研究脉络,第四章聚焦AR/VR HWD力与扭矩复合测量方法的开发与验证。结合角急动度指标,该测量体系通过提供用户工作负荷、疲劳度等客观基准数据,深化AR/VR HWD运动数据分析,同时具备安全监控与其他数据测量功能。基于此类数据,机器成员可深度认知用户的疲劳度、损伤倾向等影响即时能力的要素,进而优化人机协作效能。
第五章系统梳理SSA文献体系,初步构建基于SSA原则的界面评级工具。该工具类似于SAGAT型评估体系,可供开发者量化用户SSA水平,检验界面设计对SSA的增强效果。后续研究中,本调查工具将用于验证本章开发的界面准则对用户SSA的提升作用。
最终章节通过实证研究完善SSA原则体系并验证测量指标。本研究采用VR界面,整合前期实验数据与第五章文献综述成果,系统验证已确立的原则与测量方法。研究成果不仅支持SSA增强型团队协作的预防性设计,还可实现设计方案的实时与回溯评估,推动界面迭代优化。相较于第二章初始研究,本测试平台显著增强交互性,通过提升搜索任务复杂度迫使用户深度依赖系统组件,从而在主动强化SSA的同时验证其有效性(详见章节详述)。
后勤数据分析中心(LDAC)是美国陆军后勤保障数据与技术解决方案的集成中枢。作为陆军装备司令部(AMC)G3部门监管下的独立报告机构,LDAC通过提供战略支援区至战术需求点的全谱系保障数据、信息技术与决策支持,强化部队战备水平并优化高级指挥官决策效能。
依托专业领域知识与软件开发能力,LDAC实现原始数据业务化转型,将其提升为可执行洞察,同时保障后勤领域数据质量,管理陆军后勤决策支持技术基础设施,并为陆军"转型保障"进程奠定战略基础。LDAC承担AMC与陆军后勤数据分析枢纽职能,有效弥合领导层战略意图与技术产出间的鸿沟。
为实现上述使命,LDAC下设四大职能板块:任务支援处、战略战备处、项目管理处与全寿命周期保障处。
美海军陆战队参考出版物(MCRP)2-10A.5《远程传感器作战》是对《海军陆战队条令出版物第2号:情报》与《海军陆战队作战出版物2-1:情报行动》的补充与扩展。本出版物详细阐述实施远程传感器作战及支援陆空特遣部队的条令原则、战术技术及操作程序。
MCRP 2-10A.5系统阐述远程传感器作战的条令基础、指挥控制、通信与信息系统支援、任务规划、实施流程及训练要求。内容既为陆战队员理解、规划与执行远程传感器作战任务提供必要指导,也为负责相关行动规划与实施的情报人员提供支援信息。本出版物取代下列文件:1997年7月17日版MCRP 2-10A.5《远程传感器作战》;1998年6月24日勘误表;2004年7月13日勘误表;2016年5月2日勘误表;以及2018年4月4日发布的变更1。
可解释推荐在帮助用户理解推荐逻辑方面展现出显著优势,从而提升了推荐系统的透明性、有效性与可信度。为提供个性化且具可解释性的推荐解释,现有研究通常将大型语言模型(Large Language Models, LLMs)的生成能力与协同过滤(Collaborative Filtering, CF)信息相结合。由用户-物品交互图中提取的CF信息能够有效捕捉用户行为与偏好,对于生成具有信息价值的推荐解释至关重要。 然而,由于图结构本身的复杂性,从图中有效提取CF信息仍然面临挑战。此外,现有方法在将提取到的CF信息与LLMs集成时也存在困难,主要受限于CF信息的隐式表示形式及图结构与自然语言之间存在的模态差异(modality gap)。 为解决上述问题,我们提出了一种新框架——G-Refer,即基于图检索增强的大型语言模型用于可解释推荐。具体而言,我们首先设计了一种混合图检索机制,从结构与语义两个角度联合检索出显式的CF信号。随后,提出的图翻译模块将检索得到的CF信息转化为人类可理解的自然语言文本,为LLMs生成推荐解释提供基础信息支撑。 为了进一步缩小模态差异,我们引入了知识剪枝机制与检索增强微调(Retrieval-Augmented Fine-Tuning)策略,增强LLMs在处理和利用CF信息生成高质量解释方面的能力。 大量实验证明,G-Refer在可解释性与稳定性方面均优于现有主流方法,表现出更强的泛化能力和用户可接受性。 项目代码与数据已开源,地址为:https://github.com/Yuhan1i/G-Refer
奖励函数在强化学习(Reinforcement Learning, RL)中具有核心地位,引导智能体实现最优决策。由于强化学习任务通常具备高度复杂性,因此需要精心设计的奖励函数,既能有效驱动学习过程,又能避免引发意料之外的行为后果。有效的奖励设计旨在提供有助于智能体快速收敛至最优行为策略的学习信号。设计奖励的挑战在于:如何使其与任务目标保持一致、激励期望行为并抑制不良行为,这一过程本身就极具难度。 本论文深入探讨了奖励信号在强化学习中的关键作用,重点分析其对智能体行为及学习动态的影响,同时系统讨论了如延迟、模糊或复杂奖励信号所带来的挑战。在本研究中,我们从多个维度研究了奖励塑形(Reward Shaping)的问题。 首先,我们从“教师/专家”视角出发(即“教师驱动”方式),研究如何设计信息丰富且可解释的奖励信号。在此场景中,专家掌握最优策略及其对应的价值函数,并据此设计奖励信号,以加速智能体向最优策略的收敛过程。 其次,我们在教师驱动方法基础上提出了一种新颖的自适应可解释奖励设计方法。在该方法中,专家会根据学习者当前的策略动态调整奖励函数,从而确保学习方向的对齐与最优性进展。 最后,我们提出一种元学习(Meta-Learning)方法,使智能体能够在没有专家参与的情况下在线自我设计奖励信号(即“智能体驱动”)。该方法综合考虑了智能体的学习过程与探索行为,从而构建了一个自我改进的反馈机制,实现奖励信号的自主生成与优化。
基于Transformer的基础模型已成为时间序列分析领域的主流范式,在预测、异常检测、分类、趋势分析等多种时间序列分析任务中展现出前所未有的能力。本文综述了当前最新的预训练基础模型,提出了一种新颖的分类方法,从多个维度对相关模型进行系统性梳理。具体而言,我们按照架构设计对模型进行分类,区分了采用基于patch的表示方法的模型与直接处理原始序列的模型。该分类体系还包括模型是否提供概率性或确定性预测,以及模型是专为处理单变量时间序列设计,还是可直接处理多变量时间序列。 此外,分类框架还涵盖了模型的规模与复杂度,突出轻量级架构与大规模基础模型之间的差异。本综述的一大特色是引入了以训练阶段所使用的目标函数类型为依据的分类方式。通过综合上述多个视角,本文旨在为研究人员与业界从业者提供参考资料,洞察当前研究趋势,并指明基于Transformer的时间序列建模未来的发展方向。
时间序列数据是现代数据分析中的关键组成部分,广泛应用于金融、医疗健康、经济学、气候科学、库存管理、能源管理、交通管理、物联网(IoT)、工业流程、供应链优化、电信、零售分析、社交媒体监控、传感器网络、天气预测,甚至医疗诊断等多个领域。时间序列分析的重要性在于其能够捕捉时间依赖性和趋势性,对于缺失值填补、分类、预测及异常检测等任务至关重要。例如,在金融领域,时间序列数据可用于预测股价或识别市场异常;而在医疗健康领域,时间序列分析能够实现患者生命体征的实时监控,及早发现潜在疾病或预测疾病暴发。在气象学中,其对天气模式和气候变化的预测尤为关键;而在经济学中,时间序列分析有助于预测如通货膨胀和国内生产总值(GDP)增长等关键指标。在能源领域,时间序列数据对于优化需求预测和资源调配具有重要价值;在库存管理中,它有助于预测库存水平并提升供应链效率。在电信领域,时间序列数据用于网络流量分析和预测性维护;在零售行业中,它支持需求预测与顾客行为分析。在制造业中,时间序列分析能够优化生产调度并监控设备健康;而在交通运输中,则有助于预测交通模式并优化车队管理。图1展示了在无需微调或微调基础模型的情况下,在不同领域中应用时间序列任务(如预测、聚类、插补等)的实例。 传统的时间序列分析方法主要依赖统计学方法,如移动平均(MA)、指数平滑等,这些方法通过对数据平滑处理来识别潜在趋势。诸如自回归移动平均整合模型(ARIMA)等方法,结合了自回归(AR)与移动平均(MA)成分,广泛用于建模时间相关结构。基于局部加权回归的季节性和趋势分解(STL)方法也常用于将时间序列分解为趋势、季节性与残差成分。在图2中,我们展示了苹果公司(AAPL)在5分钟时间框架下的日内价格波动,使用了15周期的简单移动平均(SMA)与指数移动平均(EMA)两种常见技术分析指标对价格进行平滑处理并识别潜在趋势。 尽管这些传统方法在多数场景下有效,但在面对更复杂的非线性模式或高维数据时往往力不从心。相比之下,支持向量机(SVM)与梯度提升机(GBM)等机器学习算法在捕捉更复杂的时间依赖性方面表现更佳,尤其是数据趋势较为简单或线性时。然而,这些算法在处理不规则采样数据或依赖人工特征工程以提取时间特征时面临较大挑战。例如,ARIMA模型难以捕捉长期依赖关系或非线性关系;传统机器学习算法通常依赖繁琐的数据预处理与特征选择才能在时间序列任务中取得良好表现。此外,这些传统模型常常依赖数据平稳性或均匀采样等假设,这在实际应用中往往无法满足。例如,在传感器数据或具有不规则交易时间的股市数据中,传统方法的表现往往不佳,从而推动了更先进技术的发展需求,以更有效应对这些复杂性。
为克服上述局限,神经网络,尤其是循环神经网络(RNN)与卷积神经网络(CNN),近年来成为时间序列建模的强大替代方案。神经网络具备从原始输入中自动学习分层表示的能力,从而免去了大量人工特征工程。这种“端到端”的学习方式使模型能够自动捕捉数据中的潜在结构,尤其适用于存在复杂非线性时间依赖关系的预测、异常检测和分类任务。RNN由Rumelhart等人在1980年代提出,专为处理序列数据而设计,能够通过维护隐藏状态捕捉历史输入信息。在每个时间步,RNN基于当前输入与前一状态更新隐藏状态,从而建模时间依赖关系。这使得RNN非常适合于诸如股价预测、天气预测或传感器数据分析等场景。 然而,尽管RNN理论上具备建模序列依赖的优势,但其在实际训练过程中存在“梯度消失”问题。在采用时间反向传播(BPTT)训练RNN时,梯度在长序列中反向传播过程中可能变得极小,从而难以学习长期依赖关系。在面临需要捕捉远距离依赖或长序列预测的任务中,RNN的表现通常不尽如人意。为缓解该问题,Hochreiter与Schmidhuber于1997年提出了长短期记忆网络(LSTM),通过引入记忆单元和门控机制(输入门、遗忘门和输出门)来控制信息的保留与丢弃,从而有效捕捉长期依赖。Gated Recurrent Unit(GRU)由Cho等人在2014年提出,是LSTM的简化版本,采用重置门和更新门,在保留性能的同时提高计算效率。 尽管LSTM与GRU在许多时间序列任务中(如股价预测、能源需求预测、传感器异常检测)已表现优于传统RNN,但它们在处理大规模数据时仍面临诸多挑战: 1. 序列性与并行化限制:RNN需逐步处理时间序列,导致训练与推理难以并行化,计算成本高、耗时长; 1. 长期依赖建模难度:即使是LSTM与GRU,面对极长或高度复杂的序列时仍可能出现梯度消失/爆炸; 1. 资源开销:在大规模数据集上训练RNN类模型需消耗大量内存与计算资源,难以满足实时性或资源受限环境的需求; 1. 过拟合与泛化能力弱:参数较多的RNN模型在数据量不足时易发生过拟合,泛化性能较差。
Transformer架构于2017年首次提出,标志着序列建模范式的重大转变。Transformer最初用于自然语言处理(NLP)任务,其核心创新是自注意力机制,可在无递归结构的前提下建模序列中元素间的依赖关系。与RNN不同,Transformer能够并行处理整个序列,从而显著提升训练效率。其自注意力机制使模型能动态关注序列中任意位置的相关信息,对于建模长距离依赖关系尤为有效。 Transformer架构能够在较低计算成本下建模复杂时间依赖,克服了RNN在处理不规则采样间隔或非线性跨尺度模式时的局限性。同时,由于不依赖递归结构,Transformer有效规避了梯度消失问题,自注意力机制实现了序列中任意位置之间的信息直接传递,使得模型能捕捉更复杂的时间关系。 因此,基于Transformer的模型迅速在时间序列分析中获得关注,并在多项任务中(如预测、异常检测)超越了传统方法与RNN架构。近年来,许多专为时间序列设计的Transformer变体相继出现,如 Time Series Transformer (TST)、Informer 等,它们在长序列建模与不规则数据处理方面表现出色。
传统时间序列建模方法通常对每条序列独立建模,这在面对大规模或时间模式多样的序列时难以取得良好效果,因为这种方法无法捕捉跨序列的共性与共享模式。相比之下,Transformer模型可在整体数据上统一训练,从而提取跨序列的通用特征,构建更具鲁棒性与泛化能力的基础模型。 随着对这一优势的认识加深,学术界与工业界对基于Transformer架构的时间序列建模兴趣日益增长,目标在于开发更准确、高效、可扩展的解决方案,适用于预测、异常检测、分类等任务。Transformer在NLP与计算机视觉中的成功进一步证明了其跨领域的广泛适用性,为时间序列分析提供了新的建模范式。 基于Transformer的模型的快速发展及其在多个领域的持续成功表明,这不仅仅是一种短暂的趋势,而是对传统序列建模方式的根本性变革。未来,Transformer架构有望在时间序列分析中发挥关键作用,推动预测精度、异常检测能力与对时序数据的理解水平不断提升,助力多个领域的数据驱动决策与智能系统发展
机器之心报道 编辑:蛋酱、+0
刚刚,斯坦福大学正式发布了《2025 AI Index》报告。
在过去的一段时间里,人工智能领域经历了一场蓬勃的发展,但与此同时,也有人说「人工智能是一个泡沫」。其他的讨论话题包括但不限于:人工智能的现有技术和架构将不断取得突破;人工智能走在一条不可持续的道路上;人工智能将取代你的工作;人工智能最擅长的就是把你的家庭照片变成吉卜力工作室风格的动画图像……
每一年的斯坦福 AI Index 报告都会对领域的发展进行系统的梳理,今年也是如此。《2025 AI Index》报告总共 400 多页,涵盖了研发、技术性能、负责任的人工智能、经济影响、科学和医学、政策、教育和公众舆论等主题的图表和数据。
报告地址:https://hai.stanford.edu/ai-index/2025-ai-index-report
目录如下:
除了谷歌、OpenAI 之外,中国公司 DeepSeek 也成为报告关注的焦点,在 PDF 全文中被提到了 45 次。
关于今年 AI Index 报告的核心内容,我们通过 12 张图片来了解:
美国公司的遥遥领先
虽然衡量国家在人工智能竞赛中「领先」的方式多种多样(如期刊文章发表或引用数量、专利授权等),但一个直观的评估指标是观察哪些国家发布了具有影响力的模型。研究机构 Epoch AI 拥有一个从 1950 年至今的重要人工智能模型数据库,AI Index 从中提取了相关数据进行分析。
数据显示,去年美国发布了 40 个知名模型,中国发布了 15 个,欧洲仅有 3 个(均来自法国)。另有数据表明,2024 年发布的这些模型几乎全部来自产业界,而非学术界或政府部门。关于 2023 年至 2024 年知名模型发布数量减少的现象,AI Index 认为可能是由于技术复杂度提高和训练成本持续攀升所致。
说到训练成本……
在这方面,AI Index 缺乏精确数据,因为许多领先的人工智能公司已停止公开其训练过程信息。斯坦福研究人员与 Epoch AI 合作,基于训练时长、硬件类型和数量等详细信息,估算了部分模型的成本。在可评估的模型中,最昂贵的是谷歌的 Gemini 1.0 Ultra,训练成本约达 1.92 亿美元。训练成本的全面上涨与报告中的其他发现相符:模型在参数数量、训练时间和训练数据量等方面持续规模化扩张。
值得注意的是,DeepSeek 并未包含在这一分析中。这家公司在 2025 年 1 月声称仅用 600 万美元训练出了 DeepSeek-R1,引发金融市场震动,虽然部分行业专家对此说法持怀疑态度。
AI Index 指导委员会联合主任 Yolanda Gil 在接受 IEEE Spectrum 采访时表示,她认为 DeepSeek「非常令人印象深刻」,并指出计算机科学历史上充满了早期低效技术被更优雅解决方案取代的案例。她补充道:「我不是唯一一个相信某个时点会出现更高效版本大语言模型的人。我们只是不知道谁会构建它以及如何构建。」
使用人工智能的成本正在下降
尽管大多数 AI 模型的训练成本持续攀升,但报告中强调了几个积极趋势:硬件成本降低、硬件性能提升及能源效率提高。
这使得推理成本(即查询已训练模型的费用)正在急剧下降。这张使用对数比例的图表展示了 AI 性能每美元的发展趋势。报告指出,蓝线表明每百万 tokens 的成本从 20 美元降至 0.07 美元;粉线则显示在不到一年时间内,成本从 15 美元降至 0.12 美元。
人工智能的显著碳足迹
虽然能源效率提高是一个积极的趋势,但存在一个不容忽视的问题:尽管效率有所提升,整体能耗仍在增长,这意味着处于人工智能热潮中心的数据中心留下了巨大的碳足迹。AI Index 基于训练硬件、云服务提供商和地理位置等因素,估算了特定 AI 模型的碳排放,发现前沿人工智能模型的训练碳排放量呈稳步增长趋势 —— 其中 DeepSeek 模型是个例外。
数据显示,最大的排放源是 Meta 的 Llama 3.1 模型,估计产生了 8930 吨二氧化碳排放,相当于约 496 个美国人一年的生活碳排放量。这一显著的环境影响解释了为何人工智能公司正积极采用核能作为可靠的零碳能源来源。
人工智能模型性能差距持续缩小
美国在已发布的知名模型数量上仍然保持领先地位,但中国模型在质量方面正在迅速赶上。数据显示,在聊天机器人基准测试上的性能差距正在不断缩小。2024 年 1 月,顶尖美国模型的表现比最优中国模型高出 9.26%;到 2025 年 2 月,这一差距已缩小至仅 1.70%。报告在推理、数学和编程等其他基准测试中也发现了类似趋势。
人类最后的考试
今年的报告指出了一个不可忽视的事实:用于评估人工智能系统能力的众多基准测试已经「饱和」—— 人工智能系统在这些测试上获得的分数如此之高,以至于它们不再具有区分价值。这种现象已在多个领域出现:通用知识、图像推理、数学、编程等。
Gil 表示,她惊讶地目睹一个又一个基准测试逐渐失去参考意义。她指出:「我一直认为性能会趋于平稳,会达到一个需要新技术或根本不同架构才能继续取得进展的临界点。但事实并非如此。」
面对这种局面,执着的研究人员不断设计新的基准测试,以期挑战人工智能系统。其中一项是「人类的最后考试」,它由来自全球 500 个机构的专业领域专家贡献的极具挑战性问题组成。到目前为止,即使对最顶尖的人工智能系统而言,这项测试仍然难以攻克:OpenAI 的推理模型 o1 目前以 8.8% 的正确答案率位居榜首。业界正密切关注这种局面能持续多久。
公共数据面临的威胁
当今生成式 AI 系统通过训练海量从互联网抓取的数据获得智能,这导致了一个经常被提及的观点:「数据是 AI 经济的新石油」。随着人工智能公司不断挑战可输入模型的数据量极限,业界开始担忧「数据峰值」问题,以及何时会耗尽这种关键资源。一个问题是,越来越多的网站正在限制机器人爬取并抓取其数据(可能是因为担忧人工智能公司从其数据中获利,同时破坏其商业模式)。网站通过机器可读的 robots.txt 文件声明这些限制。
数据显示,顶级网络域名中 48% 的数据现已被完全限制访问。然而,Gil 指出,人工智能领域可能会出现新方法,终结对庞大数据集的依赖。她认为:「预计在某些时候,数据量将不再如此关键。」
企业资金持续涌入人工智能领域
过去五年,企业界已为人工智能投资敞开了资金闸门。虽然 2024 年的全球总体投资未能达到 2021 年的疯狂高峰,但值得注意的是,私人投资规模达到了前所未有的水平。在 2024 年 1500 亿美元的私人投资中,相关指数的另一项数据表明,约 330 亿美元流向了生成式 AI 领域。
企业等待人工智能投资的巨大回报
理论上,企业投资人工智能是因为期望获得可观的投资回报。在这个话题上,人们常以激昂语气讨论人工智能的变革性本质和前所未有的生产力提升。然而,企业尚未见到能带来显著成本节省或实质性新收益的转变。
麦肯锡调查数据显示,在报告成本降低的企业中,大多数节省幅度不足 10%;在因人工智能获得收入增长的企业中,大多数报告的增长幅度不到 5%。巨大的回报可能仍在路上,从投资数据来看,众多企业正在押注于此,但目前尚未实现。
AI 医生或将很快接诊
科学与医疗领域的人工智能应用是人工智能浪潮中的一个重要分支。报告列举了多个新发布的基础模型,这些模型旨在协助材料科学、天气预报和量子计算等领域的研究人员。众多公司正尝试将人工智能的预测和生成能力转化为盈利性药物研发。OpenAI 的 o1 推理模型最近在医学执照考试问题集 MedQA 的基准测试中取得了 96% 的得分。
然而,这似乎仍是一个潜力巨大但尚未转化为显著实际影响的领域 —— 部分原因可能是人类尚未完全掌握如何有效使用这项技术。2024 年的一项研究测试了医生在使用 GPT-4 作为常规资源补充时是否能做出更准确的诊断。结果表明,这既未提高诊断准确性,也未加快诊断速度。值得注意的是,单独使用的 GPT-4 表现却优于人机团队和单独的人类医生。
美国的人工智能政策行动转向州级层面
这张图表显示,美国国会虽有大量关于人工智能的讨论,但实际行动寥寥无几。报告指出,美国的政策制定已转移至州级层面,2024 年共有 131 项法案在各州获得通过。其中 56 项与深度伪造(deepfake)相关,禁止在选举中使用深度伪造技术或借此传播未经同意的私密图像。
美国之外,欧洲已通过《人工智能法案》(AI Act),该法案要求开发被认定为高风险的人工智能系统的公司承担新的责任义务。然而,全球主要趋势是各国联合发表关于人工智能应在世界上扮演何种角色的全面但无约束力的声明。因此,实质性监管行动相对有限,而讨论却十分广泛。
人类是乐观主义者
无论你是股票摄影师、营销经理还是卡车司机,关于人工智能是否以及何时会取代你的工作,社会上已有广泛讨论。然而,最近一项关于人工智能态度的全球调查显示,大多数人并不感到受到人工智能的威胁。
来自 32 个国家的 60% 受访者认为人工智能将改变他们的工作方式,但仅有 36% 的人预期会被替代。「这些调查结果确实让我感到惊讶,」Gil 表示,「人们认为『人工智能将改变我的工作,但我仍将创造价值』,这种观点非常令人鼓舞。」让我们拭目以待,看看我们能否都通过管理人工智能团队来持续创造价值。
更多细节,可参考报告原文。
现代战场正经历由人工智能、机器人技术与传感器技术驱动的快速变革。无接触技术作为关键转型方向,通过提升士兵效能、增强态势感知与降低伤亡率,正在重塑战争形态。本文深入探讨无接触装备在军事行动中的崛起,解析其当前能力与未来战争变革潜力。
传统作战中,士兵依赖手持设备与人工操控完成通信、导航与武器操作。这种模式在快节奏、高压力作战环境中暴露多重缺陷:
无接触技术通过语音控制、手势识别与增强现实等创新方案,实现作战交互革命性突破。士兵无需转移武器操控或战场视野,即可完成装备控制与关键信息获取。
无接触技术的军事应用远景超越界面替代,致力于构建士兵与环境间的直觉化交互通道:
无接触技术正在重塑军事行动范式,赋予士兵前所未有的作战效率、态势掌控与任务效能。随着技术成熟与装备整合深化,其将根本性改变士兵与装备、战场的交互方式,锻造更具敏捷性、适应性与杀伤力的未来部队。向无接触化转型不仅是技术跃升,更是复杂动态战场环境中维持战略优势的核心要务。
参考来源:unboundautonomy
美国海军发布了《海军与陆战队数字系统工程转型战略》(DSETS),推动全兵种组织变革,要求从传统文档中心的需求-采办-保障(R/A/S)模式转向集成数字环境(Bray 2020)。基于模型的系统工程(MBSE)等先进数字工具可提升装备全生命周期内的设计流程、互操作性、功能维护与保障效能(Zimmerman等 2017),为新一代无人水面舰艇(USV)等自主系统赋予战术优势(Del Toro 2024)。
自主系统设计需应对复杂技术挑战,但过度关注自动化功能往往导致人因工程与工效学(HF/E)要素缺失(Lee & Seppelt 2009;Liu等 2016)。研究表明,HF/E整合不足将危及作战安全、系统性能与人机交互(Hancock 2019;Parasuraman & Riley 1997)。本研究强调HF/E要素应作为先导设计条件,而非事后补丁。通过构建经过验证的USV人因需求MBSE框架,为决策者提供结构化数字模板。核心研究问题(RQ1)聚焦:USV综合HF/E需求框架的构成要素?经验证模型涵盖11个核心组件与6类通用功能下的117项需求,涉及感知、认知、时域、人机工程与辅助领域,经专家验证可有效应对自主系统设计、操作与维护中的关键挑战。该框架旨在优化人机交互、降低失误率、缓解认知负荷并增强态势感知。
补充研究问题(RQ2)探究MBSE技术优势。通过框架构建、修正与验证过程中的实证研究,揭示MBSE在需求捕获、可追溯性、版本控制与产品生命周期管理(PLM)方面的优势(Visure;Zimmerman等 2017)。专家访谈证实MBSE在复杂架构中管理HF/E需求的有效性,验证本研究采用MBSE在数字生态中捕获与管理需求的可行性。研究还表明MBSE提供可扩展的数字化工程解决方案,符合国防部(DoD)与海军数字化转型目标,为开发最优自主系统奠定基础框架。
无人水面舰艇(USV)等先进自主系统的快速应用、开发与优先部署需要大量带宽、精力与关注度。此类资源的高度倾斜导致关键人因工程与工效学(HF/E)需求被忽视,引发错误信任、不切实际的预期、操作失误及系统故障(Lee & Seppelt,2009;Vicente,2003)。
自主系统需整合机器学习算法、通信系统、复杂计算机编程与传感器等先进技术要素,这些方面需要工程团队投入大量资源,并受到利益相关方同等关注。美国海军加速部署配备先进技术的USV,增加了忽视关键HF/E需求的风险。传统文档中心方法加剧此问题,割裂需求-采办-保障(R/A/S)流程,阻碍HF/E专家与工程团队的有效协作(Muhammad等,2023;Zimmerman等,2017)。此类疏漏将推高长期保障成本、导致重复设计、需专业干预措施,并为操作与维护人员制造低效环节(Hancock,2019;Liu等,2016;Salmon,2019)。设计需求必须包含并优先考虑HF/E要素,以优化系统交互、安全性及USV整体性能(Proctor & Van Zandt,2018;Vicente,2003)。现有文献既未明确USV设计所需的HF/E要素,也未提出系统性实施框架。
将HF/E需求整合至USV设计初始阶段至关重要。整合HF/E与工程学科的庞杂信息、流程与活动,需摒弃孤立式"非数字化"系统开发模式(Bray,2020;Muhammad等,2023;Zimmerman等,2017)。本研究识别并捕获USV设计与操作所需的HF/E要素,采用基于模型的系统工程(MBSE)软件构建结构化需求框架。该可复用、可调整的框架使HF/E要素成为系统之系统(SoS)架构的数字基础需求,涵盖感知、认知、时域、人机工程与组织维度,优化有人-无人协同作战(MUM-T)。通过构建包含结构、行为、活动与参数模型的系统架构,为设计团队提供满足需求的集成化数字生态系统(Hause,2011)。
本研究采用混合研究方法获取有效HF/E数据,通过专家访谈验证框架与建模技术。项目管理方采用经验证的HF/E需求框架将提升USV安全性、效率与效能(Lau等,2020;Ramos等,2022)。研究成果支持美国海军在科技与数字工程领域的持续投入,在HF/E常被忽视的现状下提升USV设计与作战效能。该可复用、可定制的HF/E模型体现了对自主系统操作人员的责任承诺。正如美国特种作战司令部(USSOCOM)强调:"人员而非装备决定成败",特种部队信条"人员重于硬件"(USSOCOM,未注明日期)即为此理念的集中体现。
本研究通过将HF/E需求嵌入设计核心,填补USV开发与部署的关键空白。将此类要素纳入集成数字架构可提升作业安全、优化人机交互并增强需求可追溯性(Carrol & Malins,2016;Liu等,2016)。研究强调因HF/E缺陷导致的系统修改与保障成本将使USV"离线",影响远程海上行动。所构建的可移植模型亦适用于其他军用与民用自主平台领域。提升认知与推动需求采纳是本研究的核心驱动力,旨在优化人员福祉、MUM-T协同与系统性能(Lee & Seppelt,2012)。
Proctor与Van Zandt(2018)阐明了HF/E的基本原则:忽视该要素将导致性能下降、错误率上升与风险增加。本研究运用数字图表与建模工具捕获并优化USV适用的HF/E要素。采用的MBSE方法支持需求的系统化开发、整合与验证(Lu等,2022;Madni & Sievers,2018)。将HF/E需求整合至USV系统模型,使其成为基础"构建模块",通过功能与活动模型实现需求验证。
本研究成果对HF/E学术界、科研界与工业界具有重要价值。研究反馈证实HF/E要素对创建健康高效工作环境的必要性。Håkansson与Bjarnason(2020)强调将HF/E视角融入需求工程(RE)可降低压力并提升用户满意度。参与USV"论域"构建的项目办公室、需求制定方、操作维护人员须践行此理念(参见术语表)。经验证的HF/E框架通过集成反馈机制促进安全高效的操作环境与持续改进,通过迭代优化应对新兴挑战与利益相关方需求。
本研究契合美国海军战略文件提出的数字化转型与现代工程目标。Bray(2020)指出数字模型在海军R/A/S流程中的重要性,可打破"卓越孤岛"并增强协作效能。Zimmerson等(2017)强调变革管理策略、数字工具应用与持续利益相关方参与对转型的关键作用。本研究通过MBSE构建HF/E需求框架,支持海军数字化转型战略。经验证框架可供海军及跨领域自主系统开发人员使用,其双重意义在于:优先考虑以人为中心的设计原则提升USV功能,同时践行海军数字工程战略。