FM 3-39阐述了宪兵团的作战条令。本手册与联合及陆军条令保持一致,其他宪兵条令出版物均以本手册确立的原则为基础,并与相应的联合及陆军出版物保持同步。为充分理解本手册所含条令,读者须首先掌握ADP 3-0所述多域作战的本质特征。本手册读者须熟悉ADP 1阐述的陆军职业与道德准则、ADP 5-0提出的作战流程基础、ADP 6-0界定的任务指挥原则、ADP 3-37论述的防护原则,以及FM 3-0概述的陆军行动准则。
FM 3-39的主要适用对象为各层级指挥官与参谋人员,以及负责规划、指导与执行宪兵任务的军事警察人员。全陆军训练开发人员与教育工作者均使用本手册。指挥官、参谋与下属须确保其决策与行动符合适用的美国法律、国际法及特定情况下的东道国法律法规。各级指挥官须确保其士兵遵守武装冲突法与交战规则(参见FM 6-27/MCTP 11-10C)。
本版FM 3-39与FM 3-0保持一致,阐述宪兵部队的编制、装备与训练体系如何支撑陆军实施快速持续地面作战以击败敌军、攻占并固守区域的作战能力。宪兵通过支持陆军能力的合成运用,创造并利用相对优势达成作战目标、击败敌军力量,并为联合部队指挥官巩固战果。尽管陆军绝大多数行动发生于武装冲突门槛之下或有限应急行动期间,但陆军战备仍聚焦于大规模作战行动。相较于有限应急行动,大规模作战行动强度更高、破坏性更大,常造成重大伤亡,这要求宪兵部队必须做好遂行最严苛高危任务的准备。
FM 3-39为宪兵部队提供条令框架,阐明其如何通过目标导向编组与技术能力赋能陆军完成使命、击败敌军并持续巩固符合联合与国家战略目标的战果。宪兵部队为实施多域作战及大规模作战的陆军力量提供可定制化灵活支援,通过持续巩固战果为可持续性持久成果创造条件。
宪兵部队通过行使专属权限与能力(依托警务行动、拘押行动与安保机动支援三大核心职能),支持指挥官达成作战目标,应对常规与非常规威胁,助力联合职能与陆军作战职能实施。FM 3-39阐述宪兵在潜在多国或跨机构领导下的多国行动中所扮演角色,以及在多样化指挥关系中的职能定位。本手册详述宪兵如何整合跨职能的警务情报行动,为指挥官与参谋机构提供相关信息与警务情报,提升对复杂作战环境的态势认知能力。
无论作战环境如何,建立并维系社群信任始终是警务执法成功的基石。社群信任是宪兵部队与其服务对象之间确立的高度互信关系,其构建与维系需持续投入大量努力。宪兵行动遵循六项原则(预防、公众支持、克制、合法性、透明度和评估),确保宪兵与受助、受护及受防群体建立可信赖的工作关系。
FM 3-39基于陆军及宪兵近250年的经验积淀、教训总结、新兴联合与陆军条令,以及当前作战实践经验编纂而成,旨在为宪兵团成功奠定基础。尽管战争本质亘古不变,但战争形态与实施方式持续随新概念、新技术与新需求演进。本手册延续宪兵行动条令发展脉络以支撑多域作战,强调宪兵在武装冲突门槛下的竞争、危机与武装冲突各阶段的支援职能。FM 3-39植根于经时间检验的原则与基础,同时兼容新技术与编制变革,主要更新内容包括:
• 更新宪兵对作战环境的可视化与认知框架
• 更新宪兵对战争层级的支援模式
• 引入战略背景下的宪兵支援职能
• 阐述作战框架全流程的宪兵支援机制
• 新增宪兵行动规划补充考量要素
• 提出宪兵支援陆军行动需克服的特殊挑战
• 探讨数据与分析法在宪兵规划中的应用
• 整合宪兵部队结构调整与编制变革
本手册共分五章及三个附录:
第1章 阐述宪兵部队如何通过核心能力实施行动以支持陆军作战,并从警务视角解析作战环境概念框架及陆军面临的关联性挑战。
第2章 探讨宪兵如何从美国本土战略支援区域至作战框架近域实施跨层级支援,并详述宪兵在陆军各战略背景下的支援职能。
第3章 概述宪兵如何整合与同步能力以赋能作战职能生成战斗力并运用于对抗敌军。
第4章 描述宪兵部队架构及作战指挥官可调用的宪兵能力。
第5章 明确宪兵部队与规划人员的计划制定与后勤保障职责、整合流程,阐述指挥支援关系及对宪兵行动产生特殊影响的后勤考量。
附录A 扩展论述宪兵职能及其对应技术战术任务。
附录B 提供现行宪兵部队编制描述与能力解析。
附录C 概述美军战场拘押制度。
本手册提供的宪兵行动基础框架(结合相关宪兵条令)为各级指挥官决策与行动提供支撑,但不可替代宪兵官兵的主动思考与主观能动性。无论条令如何完善或宪兵能力系统如何先进,宪兵官兵必须理解作战环境、识别不足,并运用专业判断实施临机应变。详见正文前第IX页导览图示。
无线通信已成为现代社会不可或缺的组成部分,其发展由移动设备激增、物联网应用及数据密集型服务共同驱动。随着全球向第六代(6G)无线网络演进,优化有限带宽与功率资源对满足日益增长的数据需求至关重要。此外,全面利用空间、空中及水下等全维度无线媒介被视为实现6G及后续网络无缝通信承诺的必要条件。本论文聚焦于克服水下与地面两种通信媒介的速率与安全难题。
声学通信是水下无线通信的主导技术。在水声网络中,本研究探索全双工(FD)与非正交多址接入(NOMA)技术以应对水下环境特有挑战,旨在提升水下通信系统的数据速率、可靠性及安全性。通过功率优化研究,实现对抗网络攻击的总速率或保密总速率最大化。所提算法在全双工与非正交多址接入结合有效干扰消除技术时,展现出增强的总速率与安全性能。
地面通信领域,精准的蜂窝信号识别对资源优化与无线网络安全至关重要。为此,本论文提出多种创新方法以增强实时识别全球移动通信系统(GSM)、通用移动通信系统(UMTS)及长期演进(LTE)等空口信号的能力。通过形态学分析与机器学习算法实现精确信号检测与识别,从而提升无线通信系统的安全性与效率。本论文通过双重媒介研究,为未来网络安全与数据速率提升提供独特解决方案。
本文采用创新方法论提升有限资源利用效率并强化未来网络安全。第二、三章聚焦于水下通信(UWC):第二章提出融合全双工与非正交多址接入的系统架构,旨在提升水声通信系统总速率;第三章评估该系统的安全鲁棒性,重点防范潜在窃听威胁。地面通信领域,运用新技术实施自动信号识别(ASI),从实测功率谱密度(PSD)中识别多制式蜂窝信号:第四章提出基于特征的似然估计法,实现功率谱密度噪声基底检测与信号数量类型识别;第五章设计前馈神经网络机器学习(ML)算法判定信号所属蜂窝制式;第六章开发卷积神经网络机器学习算法实现蜂窝信号类型识别;第七章采用极限学习机(ELM)模型提升蜂窝信号类型识别精度。最终,第八章总结研究成果并展望未来研究方向。
人工智能
来源 | 中国信息通信研究院、中国人工智能产业发展联盟(转载请注明来源) 编辑 | 数据君
新型人工智能存储相关产业、技术正处于高速发展阶段,新技术生态瞬息万变。近日,中国信息通信研究院、中国人工智能产业发展联盟发布《新型人工智能存储研究报告(2025年)》,对新型人工智能存储的概念范围、面临挑战、关键技术和最佳实践进行了梳理和分析。
报告全文如下
转载机器之心报道 编辑:Panda、杜伟
今天凌晨,从昨晚开始预热、备受全球 AI 圈关注的 Qwen3 系列模型终于正式亮相了!
Qwen3 模型依旧采用宽松的 Apache2.0 协议开源,全球开发者、研究机构和企业均可免费在 HuggingFace、魔搭社区等平台下载模型并商用,也可以通过阿里云百炼调用 Qwen3 的 API 服务。
HuggingFace 地址:https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f * Modelscope 地址:https://modelscope.cn/collections/Qwen3-9743180bdc6b48 * GitHub 地址:https://github.com/QwenLM/Qwen3 * 博客地址:https://qwenlm.github.io/blog/qwen3/ * 试用地址:https://chat.qwen.ai/
具体来讲,Qwen3 系列模型包含两款 MoE 模型以及六款密集模型,其中每一款又包含更多细分版本(比如基础版和量化版):
MoE 模型:Qwen3-235B-A22B 和 Qwen3-30B-A3B;其中 235B 和 30B 分别是总参数量,22B 和 3B 分别是激活参数量。 * 密集模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。
下表展示了这些模型的详细参数:
Hugging Face 已经上线了 22 个不同的 Qwen3 系列模型
目前,Qwen3 系列中较大的三款模型也已经上线了 Qwen Chat 网页版和手机 App。
性能方面,在代码、数学、通用能力等基准测试中,旗舰模型 Qwen3-235B-A22B 与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型表现相当。
此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现却更胜一筹。甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。
性能大幅提升的同时,Qwen3 的部署成本还大幅下降,仅需 4 张 H20 即可部署满血版,显存占用仅为性能相近模型的三分之一。
开发团队也在博客中给出了一些推荐设置:「对于部署,我们推荐使用 SGLang 和 vLLM 等框架;而对于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也非常值得推荐。这些选项确保用户可以轻松将 Qwen3 集成到他们的工作流程中,无论是用于研究、开发还是生产环境。」
该团队表示:「Qwen3 的发布和开源将极大地推动大型基础模型的研究与开发。我们的目标是为全球的研究人员、开发者和组织赋能,帮助他们利用这些前沿模型构建创新解决方案。」
Qwen 团队技术负责人林俊旸(Junyang Lin)进一步分享了 Qwen3 模型开发的细节,他称团队成员花了一些时间来找方法解决一些并不花哨的问题,比如如何通过稳定的训练来扩展强化学习、如何平衡来自不同领域的数据、如何增强对更多语言的支持等。他希望用户能够喜欢 Qwen3 模型并从中发现一些有趣的东西。他还表示,团队正迈向下一个阶段,即训练 Agent 来扩展长程推理,同时更多地关注现实世界的任务。
当然,未来开发团队也将放出 Qwen3 模型的技术报告或训练配方。
网友反馈与上手实测
和前一代 Qwen 系列模型一样,Qwen3 的发布同样吸引了全球 AI 和开源社区的关注,我们看到的也是满屏的好评。
究竟表现如何?机器之心也做了点简单的尝试。
首先来个简单的推理测试题,Qwen3-235B-A22B 不出意料地能轻松应对。
2 倍速动图
接下来,我们尝试了一个更加复杂的编程任务:编写一个贪吃蛇游戏,采用像素风格。同时有另一个需求,游戏中有一个平头哥在追赶我们控制的蛇,一旦被咬中,蛇的长度就会丢失一半。当蛇撞墙或咬到自己或长度低于 2 时,游戏结束。
视频未加速
Qwen3-235B-A22B 大概使用了 3 分钟解决这个任务。简单试玩一下,发现基本上可玩,但也有些 bug,比如平头哥的速度过快了。但考虑到这是 Qwen3-235B-A22B 在简单提示词下给出的 One-shot 结果,也就完全可以接受了。相信更精细的提示工程和迭代优化可以得到更好的结果。
我们也通过 Ollama 简单尝试了 Qwen3 系列中最小的模型 Qwen 0.6B。
看起来,这个完全可以在一台普通手机上流畅运行的小模型不仅速度很快,也足以完成很多日常的推理任务。
经过后训练的模型,例如 Qwen3-30B-A3B,以及它们的预训练基座模型(如 Qwen3-30B-A3B-Base),现已在 Hugging Face、ModelScope 和 Kaggle 等平台上开放使用。对于部署,我们推荐使用 SGLang 和 vLLM 等框架;而对于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也非常值得推荐。这些选项确保用户可以轻松将 Qwen3 集成到他们的工作流程中,无论是用于研究、开发还是生产环境。
三大核心亮点
此次,Qwen3 模型在多个方面实现了增强。
一是,支持两种思考模式,分别如下:
思考模式,模型逐步推理,经过深思熟虑后给出最终答案,尤其适合需要深入思考的复杂问题。 * 非思考模式,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。
这种灵活性使用户能够根据具体任务控制模型进行「思考」的程度。例如,复杂的问题可以通过扩展推理步骤来解决,而简单的问题则可以直接快速作答,无需延迟。
至关重要的是,这两种模式的结合大大增强了模型实现稳定且高效的「思考预算」控制能力。Qwen3 展现出的可扩展且平滑的性能提升,就与分配的计算推理预算直接相关。可以预见,这样的设计让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。
下图为在 AIME24、AIME25、LiveCodeBech(v5)和 GPQA Diamond 等基准测试集中,非思考模式与思考模式的思考预算变化趋势。
二是,支持更多语言。
目前,Qwen3 模型支持 119 种语言和方言。增强的多语言能力为国际应用开辟了新的可能性,可以让更广泛的全球用户体验到模型的强大能力。这些语言具体包括如下:
三是,Agent 能力增强。
如今,Agent 已经是大模型领域重点关注的能力之一,尤其是最近 MCP 模型上下文协议的引入更是大大增强了 Agent 的适用性和灵活性,大大拓宽了应用场景。
此次,Qwen3 模型的 Agent 和 代码能力得到增强,包括加强了对 MCP 的支持。我们可以看下面一个示例(提取 QwenLM 库的 markdown 内容,然后绘制显示项目 stars 数量的条形图),展示了 Qwen3 如何思考并与环境进行交互:
预训练数据量达 36 万亿 token 后训练实现混合推理
在预训练方面,Qwen3 的数据集相比 Qwen2.5 有了显著扩展。Qwen2.5 是在 18 万亿个 token 上进行预训练的,而 Qwen3 使用的数据量几乎是其两倍,达到了约 36 万亿个 token,涵盖了 119 种语言和方言。
为了构建庞大的数据集,开发团队不仅从网络上收集数据,还从 PDF 文档中提取信息。他们使用 Qwen2.5-VL 从这些文档中提取文本,并用 Qwen2.5 改进提取内容的质量。
另外,为了增加数学和代码数据的数量,开发团队利用 Qwen2.5-Math 和 Qwen2.5-Coder 这两个数学和代码领域的专家模型合成数据,合成了包括教科书、问答对以及代码片段等多种形式的数据。
具体而言,预训练过程分为了以下三个阶段:
在第一阶段(S1),模型在超过 30 万亿个 token 上进行了预训练,上下文长度为 4K token。这一阶段为模型提供了基本的语言技能和通用知识。 * 在第二阶段(S2),通过增加知识密集型数据(如 STEM、编程和推理任务)的比例来改进数据集,随后模型又在额外的 5 万亿个 token 上进行了预训练。 * 在最后阶段,使用高质量的长上下文数据将上下文长度扩展到 32K token,确保模型能够有效地处理更长的输入。
得益于模型架构的改进、训练数据的增加以及更有效的训练方法,Qwen3 Dense 基础模型的整体性能与参数更多的 Qwen2.5 基础模型相当,例如 Qwen3-1.7B/4B/8B/14B/32B-Base 分别与 Qwen2.5-3B/7B/14B/32B/72B-Base 表现相当。
特别是在 STEM、编码和推理等领域,Qwen3 Dense 基础模型的表现甚至超过了更大规模的 Qwen2.5 模型。可以看到,Qwen3 MoE 基础模型在仅使用 10% 激活参数的情况下达到了与 Qwen2.5 Dense 基础模型相似的性能,由此带来了训练和推理成本的显著节省。
与此同时,Qwen3 在后训练阶段同样进行了优化。
为了开发能够同时具备思考推理和快速响应能力的混合模型,开发团队实施了一个四阶段的训练流程,包括:(1)长思维链冷启动,(2)长思维链强化学习,(3)思维模式融合,以及(4)通用强化学习。
在第一阶段,使用多样的的长思维链数据对模型进行了微调,涵盖了数学、代码、逻辑推理和 STEM 问题等多种任务和领域。这一过程旨在为模型配备基本的推理能力。
第二阶段的重点是大规模强化学习,利用基于规则的奖励来增强模型的探索和钻研能力。
在第三阶段,在一份包括长思维链数据和常用的指令微调数据的组合数据上对模型进行微调,将非思考模式整合到思考模型中,确保了推理和快速响应能力的无缝结合。
在第四阶段,在包括指令遵循、格式遵循和 Agent 能力等在内的 20 多个通用领域的任务上应用了强化学习,进一步增强模型的通用能力并纠正不良行为。
Qwen 已成全球第一开源模型
Qwen3 的发布是阿里通义千问的又一里程碑,再对比一下 Llama 4 系列模型得到的社区反馈,Qwen 系列无疑已经成为全球第一的开源模型 —— 这一论断也有数据支持。据了解,阿里通义已开源了 200 余个模型,全球下载量超 3 亿次,Qwen 衍生模型数超 10 万个,已超越 Llama,成为全球最大的开源模型族群。
Qwen、Llama、Mistral 系列开源模型的衍生模型数量随时间的增加情况
在全球 AI 技术竞争日益激烈的背景下,阿里通义千问通过持续的技术创新和开放合作,推动了 AI 技术的普及与发展,展现了中国科技企业在全球开源 AI 生态中的强大影响力。
参考链接:https://x.com/Alibaba_Qwen/status/1916962087676612998
© THE END 转载请联系本公众号获得授权 投稿或寻求报道:liyazhou@jiqizhixin.com
X-51A"驭波者"验证机展示了高超音速飞行能力。该机型由普惠火箭达因公司SJY61超燃冲压发动机驱动,设计通过乘波体构型实现约6马赫极速。图片来源:美国空军
全球各国政府正争相获取被视为"未来战争制胜必备武器"的高超音速导弹。俄罗斯已在侵乌战争中动用Kh-47"匕首"高超音速导弹,中国宣称已列装包括DF-17与DF-26在内的多型高超音速武器。
Kh-47导弹并未为俄罗斯锁定胜局。事实上,乌克兰声称其美制"爱国者"防空系统已多次成功拦截该导弹。
美国正投入数十亿美元追赶高超音速技术,但高昂成本已引发项目调整。近期,美国海军因成本超支与预算限制终止"高超音速空射进攻性反水面战导弹"(HALO)项目。HALO并非美军最昂贵的高超音速项目;海军将转而聚焦AGM-158C"远程反舰导弹"(LRASM)等低速系统。
在HALO项目终止前,美国空军已宣布将完成"空射快速响应武器"(ARRW)原型研发但放弃采购计划。
新型高超音速导弹采购成本惊人。若采购385枚高超音速导弹,美国需耗资超120亿美元。作为对比,二战期间生产5万辆M4"谢尔曼"系列坦克耗资约30亿美元(1945年币值)——经通胀调整后约合540亿美元。
若将同等资金转投其他项目,当前可采购17万枚制导炸弹、250万枚155毫米炮弹、2亿发5.56毫米弹药或超170架F-16战机。未来战争或需数千枚高超音速导弹。鉴于其近乎天价的成本及对其他武器项目的挤压效应,向假想敌支付"认输费"或许将成为更经济的财政选择。
参考来源:DSM
本文提出了一项开创性的、全面的综述,首次聚焦于基于视觉-语言模型(VLMs)的3D物体检测,这是多模态AI领域快速发展的前沿技术。我们结合学术数据库与AI驱动的搜索引擎,采用混合搜索策略,筛选并分析了超过100篇最先进的论文。我们的研究首先将3D物体检测置于传统流程中,考察了如PointNet++、PV-RCNN和VoteNet等利用点云和体素网格进行几何推理的方法。随后,我们追溯到向VLM驱动系统的转变,其中如CLIP、PaLM-E和RoboFlamingo-Plus等模型通过语言引导推理、零-shot泛化和基于指令的互动,增强了空间理解能力。我们探讨了这一转变所依赖的架构基础,包括预训练技术、空间对齐模块和跨模态融合策略。通过可视化和基准比较,展示了VLMs在语义抽象和开放词汇检测中的独特能力,尽管在速度和注释成本方面存在权衡。我们的比较综合强调了关键挑战,如空间错位、遮挡敏感性和实时性有限,同时提出了新兴解决方案,如3D场景图、合成标注和多模态强化学习。本文综述不仅巩固了基于VLM的3D检测的技术格局,还提供了前瞻性的路线图,识别了有前景的创新和部署机会。它为希望在机器人技术、增强现实和具身AI中利用语言引导的3D感知的研究人员提供了基础性参考。与此综述和评估相关的项目已在Github上创建,链接为:https://github.com/r4hul77/Awesome-3DDetection-Based-on-VLMs
图1提供了一个视觉示例,展示了物体检测如何从传统的2D方法发展到更先进的3D检测技术。图像显示了一个苹果在3D空间中的检测,使用的边界框不仅捕捉了物体在X轴和Y轴上的位置,还捕捉了它的深度(Z轴)。这突出了3D检测的核心优势:比起限于平面图像坐标的2D方法,3D检测能够更准确地感知和定位物体在空间环境中的位置。如图所示,2D边界框无法完全表示物体的体积、大小或它与附近物体的关系,这些都是机器人操作或自主导航等任务中重要的因素。 物体检测本身是计算机视觉中的基础任务,广泛应用于自动驾驶、机器人、监控和增强现实等领域[Ghasemi等,2022]。其主要目标是通过在图像或传感器数据中绘制带有类别标签的框,识别和定位有意义的物体[Zou等,2023]。传统的物体检测系统主要依赖于2D图像,早期的模型使用手工特征[Agarwal和Roth,2002;Papageorgiou等,1998]。深度学习的现代突破导致了实时检测器的出现,如YOLO[Redmon等,2016]、SSD[Liu等,2016]和Faster R-CNN[Ren等,2016],即使在复杂的条件下也能实现高精度[Sapkota和Karkee,2024;Sapkota等,2024c]。然而,没有深度信息,这些2D系统在需要空间推理或在3D世界中进行物体交互的任务中表现欠佳。 为克服这些空间限制,3D物体检测方法逐渐得到了越来越多的关注,这些方法操作的是体积数据,如LiDAR点云、深度图和RGB-D输入[Wang等,2021]。这些模型提供了更完整的物体几何和空间关系表示,通常利用体素化、基于点的表示或3D卷积[Arnold等,2019;Caglayan和Can,2018]。然而,尽管这些传统的3D深度学习模型在空间推理方面提供了显著的改进,但它们也有自己的约束[Qian等,2022;Wang等,2022c]。它们需要大量的注释[孟等,2021;Xiang等,2014],需要大规模的3D数据集和详细的人工标签,而这些标签的创建既昂贵又费时[Brazil等,2023;Sølund等,2016;Tremblay等,2018]。此外,它们常常在跨领域泛化方面表现不佳[Eskandar,2024],缺乏语义灵活性[Zhang等,2021],并且在适应新物体类别或部署环境时,训练要求也非常严格[Mao等,2023;Peng等,2015]。进一步 complicating 它们的部署,传统模型往往依赖于传感器,依赖于精心校准的多模态系统,如LiDAR-摄像头融合系统[Alaba和Ball,2022],这使得它们在无控制或资源受限的环境中表现得较脆弱。 此外,这些系统在可解释性和灵活性方面也存在局限[Wang等,2022a],缺乏融入高层次、任务导向指令的能力[Chen等,2023a]。例如,它们无法理解像“只检测离手边的熟透苹果”这样的命令,也无法实时适应不断变化的任务目标或用户意图。视觉-语言模型(VLMs)的出现提供了一个具有变革性的解决方案,通过结合视觉感知和自然语言理解,VLMs为3D物体检测引入了全新的语义推理层次。如图1所示,我们的示例展示了一个现实世界中的苹果在3D空间中被检测出来,不仅具备空间精度,还通过语义理解得到了上下文的注解。该图还突出了双重优势:直接3D检测相较于2D方法的五大优点,以及VLM-based 3D检测系统相比传统CNN-based 3D检测器提供的五大独特优势。直接的3D检测方法通过提供更高的空间精度、深度感知定位、体积上下文、遮挡处理和度量尺度推理,超越了它们的2D对应物。这些能力对于现实世界的机器人应用至关重要,因为它们需要对物体的位置和交互有全面的理解。与此同时,基于VLM的方法进一步提升了这些能力,通过启用基于提示的控制[Tang等,2025b]、零-shot泛化[Zhang等,2024c]、语义意识[Zhang等,2024f]、多模态集成[Zang等,2025]和可解释性[Raza等,2025;Yellinek等,2025]。与基于CNN的系统不同,VLMs可以处理自然语言查询并将高层次推理整合到检测过程中[Chen等,2024d;Fu等,2025],允许执行像“找到适合采摘的最近苹果”这样的任务,而无需针对每个新任务进行特定的训练。
尽管基于点云处理的传统3D物体检测方法(通常基于卷积神经网络(CNN))已经取得了一定的进展,但这些方法仍然面临语义理解、数据效率和适应性方面的关键限制。如前所述,基于CNN的3D检测器通常需要昂贵的传感器校准、大规模注释数据集和严格的重新训练程序来适应新环境。更重要的是,它们缺乏复杂推理任务所需的语义可解释性,例如识别特定物体属性或响应用户定义的自然语言提示。 近年来,VLMs已成为解决传统2D和仅基于几何的3D物体检测方法固有局限性的变革性解决方案。VLMs将计算机视觉的视觉模式识别优势与大规模语言模型(LLMs)的语义推理能力相结合,能够对场景进行更丰富的多模态理解[Ma等,2024]。如图2所示,2022年11月30日ChatGPT的公开发布,引发了对LLMs前所未有的兴趣,迅速将它们确立为自然语言理解的基础工具。虽然VLMs的崛起较为渐进,但LLMs的影响促使了对多模态系统的关注增加。这种增长的兴趣在需要高层次推理和上下文理解的领域中尤为明显,如机器人技术中的3D物体检测、增强现实和自动导航。与传统的3D检测器不同,VLMs使得灵活查询、少量示例学习或零-shot学习以及语义任务泛化成为可能——这一切都无需为每个新任务重新训练。
这一范式转变在几项近期工作中得到了体现。例如,Agent3D[Zhang等,2024c]利用VLMs执行基于用户定义查询的开放词汇3D检测,使机器人能够在复杂的室内场景中定位诸如“椅子后面的红色杯子”这样的物体。同样,SpatialVLM[Chen等,2024d]引入了一种空间基础的视觉-语言框架,通过对RGB-D输入的推理,检测并描述具有空间上下文的3D物体。这些模型不仅能够识别物体,还能够推理物体之间的空间关系、功能性和以人为本的目标。这将3D感知从纯粹的几何任务提升为一种认知任务,在这种任务中,模型能够理解诸如“找到树左下角的熟透苹果”这样的指令。虽然VLM趋势的爆发程度没有LLMs那么激烈,但它们显示出稳步上升的良好轨迹,标志着朝着真正智能、语义感知的3D系统的更广泛转变的初期阶段。随着多模态模型能力的扩展,VLMs有望在AI驱动的应用中架起感知与认知之间的桥梁。
综述目标
本综述的目标是系统地调查使用VLMs进行3D物体检测的发展格局,并评估它们在将空间感知与语义理解结合的日益重要作用。我们首先考察3D物体检测的基础概念,它从基于几何的方法发展到多模态框架的演变,以及与传统2D检测的区别。接下来,我们探讨传统的3D检测架构,包括PointNet++ [Sheshappanavar和Kambhamettu,2020]、VoxelNet [Chen等,2023b;Sindagi等,2019]和PV-RCNN [Shi等,2020],以建立对比基准。在此基础上,我们回顾基于VLM的最新方法,突出它们的开放词汇能力、语义基础和跨模态对齐。我们深入探讨了底层架构、预训练和微调策略,以及检测输出的可视化,以理解VLMs如何在3D空间中感知和推理。本综述还进一步比较了传统方法和基于VLM的方法,分析了各自的优缺点和权衡。关键地,我们分析了当前数据可用性、基础对齐精度和计算可扩展性方面的挑战,并提出了潜在的解决方案,如多模态数据集扩展和混合模型集成。通过回顾100多篇论文,本研究旨在为研究人员提供全面的路线图,深入了解VLMs赋能的3D物体检测的现有能力和未来发展方向。
本论文建立了语境结构理论,用数学方法表征表征学习的机制,也称为预训练。尽管基础模型在实践中取得了显著的成功,但仍不清楚它们学习到的表征是什么,以及这些表征为何对各种不同的下游任务有用。对表征学习的科学理解至关重要,尤其是在模型规模扩展已经呈现边际效益递减的情况下,设计新的预训练方法成为进一步发展的必要条件。 先前的工作对不同的表征学习方法进行了各自不同的处理,而语境结构理论则提供了一个统一的框架,用于阐明这些方法学习到的表征。核心论点是,表征是通过输入 X 和一个上下文变量 A 之间的关联来学习的。我们证明了,如果一个编码器捕获了这种关联的最大信息,在这种情况下我们说编码器学习了“语境结构”,那么它将在与该上下文兼容的任务类上达到最佳表现。我们还展示了,当 X 和 A 之间的关联既不太强也不太弱时,上下文最为有用。语境结构理论的重要含义是,仅仅增加模型规模将带来递减的回报,而进一步的进展需要更好的上下文。 我们证明了许多现有的预训练目标可以学习语境结构,包括监督学习、自监督学习、生成模型等。在此基础上,我们提出了两个通用目标——SVME 和 KISE,用于学习语境结构。我们还展示了如何将多个上下文混合在一起,这是从现有上下文中创建更好上下文的轻松方法。然后,我们为表征学习证明了统计学习界限,并将该框架扩展到半监督学习的谱变换核回归。最后,我们讨论了从预训练到下游任务的数据分布变化的影响。
摘要 — 大型语言模型(LLMs)正在以惊人的速度发展,并已成为学术界、工业界和日常应用中不可或缺的一部分。为了跟上当前的发展态势,本调查深入探讨了LLMs崛起对评估所带来的核心挑战。我们识别并分析了两个关键的转变:(i)从任务特定的评估到基于能力的评估,这一转变围绕知识、推理、指令跟随、多模态理解和安全性等核心能力重组基准;(ii)从手动评估到自动化评估,包括动态数据集创建和“LLM作为评审员”的评分。然而,即使在这些转变之后,仍然存在一个关键的障碍:评估泛化问题。有限的测试集无法与能力似乎无限增长的模型相匹配。我们将从方法、数据集、评估者和度量标准的角度,剖析这一问题以及上述两个转变的核心挑战。鉴于这一领域的快速发展,我们将维护一个持续更新的GitHub存储库(每个章节中都有链接)来众包更新和修正,热忱欢迎贡献者和合作者参与。 关键词 — 大型语言模型、评估、基准、调查
大型语言模型(LLMs)在学术界和工业界取得了前所未有的成功,这在很大程度上归功于训练和评估技术的快速进展。作为“质量控制系统”,评估不仅指导技术进步的轨迹,还充当潜在风险的预警机制。最近的推理型LLMs,如OpenAI的o1或DeepSeek-R1,进一步强调了评估的重要性——通过将推理、评估和随后的再推理(即细化或修正)整合到一个单一的思维链(CoT)中,它们的推理质量得到了极大提升。这些进展为评估领域注入了新的活力,产生了越来越多的基准和评估研究。为了跟上这一快速增长的步伐,我们的调查不仅仅是列出或针对特定方面的回顾。相反,我们深入探讨了基础挑战,通过考察LLMs的出现如何重塑评估领域,我们称之为评估泛化问题。
在回顾当前该领域的研究时,我们识别出两个关键转变。如图1所示,评估中的一个转变是从任务特定到基于能力的转变。传统的评估方法专注于特定任务(例如,文本分类、信息抽取)。随着LLMs将各种NLP任务统一为自然语言生成的形式,每个任务的定义及其之间的边界变得越来越模糊。在这一新范式下,每个指令或提示都可以视为一个独立的任务,从而将注意力转向评估解决现实世界需求所需的核心能力。在本调查中,我们识别出五个关键能力:知识、推理、指令跟随、多模态理解和安全性。在第二部分,我们回顾现有的基准并将其归类于这一能力框架中,进一步细分为更详细的子类别。此外,我们讨论了综合评估,评估不同能力之间的相互作用及当前的实时排行榜。这种从基于任务的评估到基于能力的评估的转变使得对模型真实潜力的全面理解成为可能,超越了其在预定义任务中的表现。 评估中的另一个转变是从手动方法到自动化方法,包括数据创建和判断。在数据方面,模型性能的快速发展要求基准更新的频率不断增加,而手动创建过程已变得不可持续,这一点在GSM8K(Grade School Math 8K)上准确率从74%到95%在两年内的飙升中得到了体现。自动化管道可以解决数据集创建中固有的成本和效率挑战。自动化的另一个好处是能够减少数据污染的风险,即测试数据在预训练或后训练过程中不小心暴露,导致性能被高估。为应对这一问题,自动化方法可以成为解决方案之一,它不断更新或细化测试集,被称为动态基准,确保测试数据在前期没有暴露。
在判断方面,如上所述,转向用户提示带来了更多开放式的响应,这提出了更多复杂性:人工判断成本高昂。自动评估器(即“LLM作为评审员”)不仅在提供可靠、高效的评估方面展现出潜力,而且还能生成更详细、更细致的人类响应评估。在第三部分,我们对这些自动化方法进行了全面回顾。
尽管研究人员在上述两个转变中取得了显著进展,但我们认为一个根本的矛盾依然存在:即通过规模法则暗示的训练范式与有限评估实践之间的矛盾。随着模型参数、训练FLOPs和数据量的增加,性能似乎可以无限提升。然而,考虑到效率,评估数据集在实践中无法无限扩展或多样化。也就是说,当前的评估管道无法与模型能力同步扩展。结果是,模型能做什么与我们的测试能覆盖什么之间的差距日益增大。这种紧张关系是LLM评估中的许多已知挑战的根源。例如,以数据污染为例,由于有限的测试数据集只能覆盖模型能力的一个子集,不同模型在评估中可能会获得异质的优势,导致不公平的比较。也就是说,如果模型在训练期间已经遇到并记住了测试样本,它的测量能力将与数据集评估的内容完全对齐,从而给予它一个不一定反映更强实际能力的过度优势。
我们将上述问题——如何利用有限的评估管道来评估一个无限的模型能力——称为评估泛化问题。换句话说,现有的评估往往集中于模型已经展现的能力或能够通过固定的测试集表达的能力,固有地限制了评估范围。因此,在LLM时代,评估的核心挑战是开发能够预测未来或尚未表达的能力的可泛化评估方法。在本调查中,我们从数据集、评估者和度量标准等不同角度,探讨这一挑战并探索潜在的解决方案。例如,一些工作专注于预测性评估,精心创建各种任务以根据小规模模型的表现来估计大规模模型的表现[1]。或者,Cao等[2]提出结合表现和基于新解释性的度量——模型利用指数(MUI),用于评估LLMs在给定数据集之外的潜力。其基本思想类似于人类评估实践:在判断一个人的整体能力时,我们既考虑结果,也考虑所需的努力(即MUI)——相同表现所需的努力较少,表示更高的熟练度。
值得注意的是,LLM评估是一个快速发展的领域。虽然我们已经尽力列出最新的文本中心评估工作,但许多研究仍处于预印本阶段。因此,我们在这里强调的是前瞻性的见解和研究方向。不可避免地,可能会出现一些遗漏或不准确的地方。我们计划维护一个专门的GitHub存储库,并邀请社区帮助我们进行改进;主要贡献者将得到感谢或被邀请作为合作者。
现代战场已不再仅依赖物理力量与火力优势。数据、速度与安全通信如今同等重要,甚至更为关键。当今军事与国防行动要求实时情报、协同响应,以及AI驱动工具、无人机与单兵可穿戴设备的无缝整合。
但核心问题在于:传统网络并非为此而生。
众多军事与公共安全机构仍依赖老旧僵化的通信系统,这些系统难以满足当下需求。即便升级改造,其底层往往基于公共基础设施,这导致延迟问题、安全漏洞与不可靠的服务质量(QoS)。
第二大挑战?多国政府首选卫星通信作为最易获取的解决方案,但此路径存在重大缺陷。
为维持战略优势,军事力量必须转向私有化高带宽无线网络——这类网络可为关键任务提供无懈可击的安全性、保障性QoS与超低延迟。
试想一支特种部队在城区冲突地带执行任务,依赖以下要素:
此时网络突发拥塞,导致视频流延迟、指令滞后与连接中断——只因关键任务应用运行在优先保障民用流量的共享基础设施上。
后果严重。前线士兵极其依赖实时通信执行任务。
此类情形绝非孤例。诸多国防机构仍依赖公共或过时基础设施,导致:
破局之道?转向可提供完全控制、强化安全与实时性能的私有无线网络。
众多军事机构依赖公共与商业网络混合解决方案,包括:
尽管此类方案提供广泛覆盖,却在关键任务环境中引发严重限制。
卫星网络虽为军事通信提供全域覆盖与偏远地区机动性,但与专用私有国防网络相比存在重大风险:
尽管具备优势,卫星系统极易遭受网络攻击、干扰乃至物理摧毁。路透社近期报道指出,部分国家正重新评估卫星军事通信依赖度——新兴技术已对其在冲突场景下的生存能力构成严峻威胁。
卫星通信在军事机动行动中面临显著挑战,尤其在复杂地形与高程变化环境中。依赖机械旋转维持卫星波束指向的抛物面碟形天线,难以在移动中保障稳定连接。这一缺陷在信号遮挡频繁的城镇作战与复杂地形战场中尤为突出。此外,机动卫星终端需配备小型天线,但其较宽的波束宽度常导致监管限制,削弱了安全无缝连接的精准维系能力。
因素 | 卫星网络(商业和共享) | 专用及受控的私人国防网络 |
---|---|---|
安全性 | 由第三方提供商运营,加密和访问控制依赖外部政策 | 完全由军方控制,确保端到端加密并符合安全标准 |
服务质量(QoS) | 与商业用户共享带宽,存在拥塞风险,无优先级保证 | 为关键任务应用保证带宽和网络切片 |
延迟 | 数据需传输数千公里至地面站,延迟较高 | 通过本地处理及边缘计算实现超低延迟 |
可靠性 | 因地缘政治、商业或监管决策易中断服务 | 关键任务正常运行时间保障,采用冗余架构,不依赖外部提供商 |
控制 | 依赖商业卫星运营商控制路由、访问和政策 | 军方全权拥有和运营,对流量路由、安全性和可用性拥有完全自主权 |
部署灵活性 | 在争议地区覆盖受限,依赖卫星定位 | 可部署于城市、偏远或恶劣环境,支持定制化配置 |
卫星通信虽具广域覆盖优势,却无法满足实时军事行动所需的高安全性、低延迟与性能保障要求。
私有无线网络为此提供更优选择。欲了解私有网络如何克服卫星局限,请参阅我们的深度分析报告。
与公共或共享网络不同,私有无线基础设施专为军事行动构建——确保无懈可击的安全性、不间断的性能与实时响应能力。
在此处详细了解私有网络如何增强军事通信网络安全。
现代国防行动日益强调机动性与去中心化。军事力量必须具备快速部署、建立通信并再度转移的能力——全程保持连接不中断。
此时,灵活且可快速部署的网络解决方案便成为关键要素。
车载基站(COW)与自动校准技术:移动国防网络的变革者
战术机动部队或前沿部署基地无法承受手动配置校准网络所需的数小时乃至数日等待时间。搭载自动校准技术的车载基站(COW)解决方案应运而生——该技术是确保战场即时稳定连接的核心工具。
通过车载基站与自动校准技术,军事团队即便身处最严苛环境,仍可依托即时高带宽连接保持战备状态。
✓ 指挥与控制(C2)通信——部署部队与总部间安全、低延迟的信息交互。
✓ 态势感知与军事物联网(MIoT)——实时千万像素级监控、无人机情报与单兵可穿戴设备互联。
✓ 自主载具与无人机集群——依赖超低延迟与高带宽连接的AI驱动军事运输系统。
✓ 增强现实/虚拟现实(AR/VR)军事训练——5G驱动的AR与VR技术强化战场模拟,为士兵提供实战化训练场景。
✓ 战术网络(MANETs/VANETs)——自组织、移动中的临时军事网络保障动态环境下的连接。
现代国防行动需要安全、高性能且始终在线的通信网络。依赖公共基础设施将导致关键漏洞——现代军队已无法承受此类风险。为确保任务成功、部队安全与实时战略协同,必须克服安全隐患、延迟问题与连接不可靠等挑战。
答案很明确?专为数字化战场构建的私有军用无线网络。
切勿将关键军事通信交付处于偶然状态。应构建直面日常挑战的安全高性能私有网络。
参考来源:ceragon
俄罗斯大幅增加对人工智能(AI)的投资,将国家预算的相当比例投入AI驱动的军事研究。此项资金旨在强化俄罗斯在现代战争中(特别是人工智能军事应用领域)的技术优势。
俄军对乌克兰的全面入侵成为首场大规模应用AI技术的重大冲突。乌克兰在美国AI企业支持下成功反制俄军,迫使俄罗斯加速AI与指挥系统、无人机及防空网络的整合进程。
无论俄乌战争结局如何,俄罗斯对AI的重点关注与高速发展已使其在面对西方武器系统时占据优势。
俄罗斯AI发展可追溯至20世纪60年代的早期苏联实验。然而真正加速始于2014年非法吞并克里米亚后的军事AI研发进程。
2月12日,总部位于德国的欧洲领先防务科技公司Helsing宣布将向乌克兰交付6000架HX-2攻击无人机(Helsing.ai,2月12日)。该型无人机搭载机载人工智能(AI)系统,具备无信号或持续数据连接条件下自主搜索、重识别与接战能力,可抵御电子战(EW)手段干扰。此次交付系继当前正在执行的4000架HF-1攻击无人机订单后新增采购。此前,俄罗斯副总理德米特里·切尔尼申科宣布将国家预算的5%投入人工智能科研领域,另有15%用于其他AI工具相关研究(Tsargrad.tv,1月31日)。此项资金的核心目标之一是利用AI技术解决军事应用难题(俄罗斯政府官网,1月31日)。随着技术在俄乌全面战争中占据核心地位,部分俄国内外军事专家将AI的广泛应用称为即将到来的"军事革命"——鉴于俄罗斯在侵乌战争中获得的实战经验,其或将成为该领域的全球主导力量之一(Discred.ru,2024年1月14日;Kommersant.ru,2021年9月15日;Focus.ua,2023年5月26日;Army.ric.mil.ru,2022年1月10日)。
俄罗斯AI技术的根源可追溯至1960年代,与泽列诺格勒"科学城"(Наукоград)的建立直接相关。该"科学城"项目(除其他科研方向外)开发了早期AI技术,获得苏联总理阿列克谢·柯西金、电子工业部长亚历山大·肖金及国防工业联合体其他要员支持(俄罗斯科学院官网,2018年8月9日)。1962年,相关研究在物理问题科学研究院(Научно-исследовательский институт физических проблем)框架下启动,来自物理、信息技术、数学、生物学与神经外科等领域的专家在此开展人工神经网络项目实验。彼时实验的核心目标在于提升苏联防空反导(PVO-PRO)系统效能。
尽管苏联领导层对新兴技术领域关注不足,但部分武器系统仍配备了全自动化的早期AI系统。例如,1983年苏联通过第686-214号决议,向海军列装首批P-700花岗岩反舰巡航导弹(具备舰载与潜射型号,可打击海上与地面目标)(俄新社,2023年8月15日;机械制造科研生产联合体官网,2024年3月2日通过网页存档访问)。1991年苏联解体后,因军费缩减,军用AI研究陷入停滞(俄罗斯科学院官网,2018年8月9日)。
俄罗斯军事现代化进程中AI技术的重要性重获关注始于2014年——因非法吞并克里米亚及煽动乌东顿巴斯地区冲突导致俄西方关系恶化。2017年,俄罗斯总统普京宣称"AI不仅是俄罗斯的未来,更是全人类的未来……掌握该领域主导权者将成为世界主宰"(Topwar.ru,2021年4月6日)。两年后,《2030年前人工智能发展战略》的颁布成为俄罗斯AI发展里程碑(克里姆林宫官网,2019年10月10日)。该战略通过总统令确立为国家AI发展计划基石,旨在"使俄罗斯AI技术占据全球市场重要份额"(克里姆林宫官网,2019年10月10日)。
2021年俄国防务专业期刊《军事思想》(Военная Мысль)刊文详述俄军AI应用的七大领域(Cyberleninka.ru,2024年2月22日访问):火控系统(定位追踪飞行目标);防空反导系统(探测摧毁飞行器);多域指挥控制(海量信息数据采集处理与系统化);战场及远程机器人作战系统;电子战;训练模拟器;可自主追踪切换目标的智能武器系统。
尽管俄军政高层认可AI的战略价值,但在2022年2月全面侵乌前,其应用仅呈零星展示。实质性变革始于俄军在乌克兰战场遭遇西方特定类型武器系统后——面对作战困境,俄军开始加速AI技术整合进程。
俄罗斯对乌克兰的全面行动成为首场主动应用人工智能(AI)的重大武装冲突,但此举亦使俄军陷入困境。据俄方消息源披露,由于美国向乌军提供支持(特别是运用美企Maven与Palantir的AI技术),乌方得以收集、解码并翻译(转乌克兰语与英语)俄军通信信息。报道称,此类支持主要用于打击俄军目标,使美国得以在实战中"测试其对俄军事AI能力"(Vzglyad,1月8日)。俄军无力反制西方技术,促使俄罗斯加大投入强化自主AI能力建设。
例如,AI成为俄国防部主办的"军队-2023"论坛核心议题。俄国防部创新发展部负责人亚历山大·奥萨德丘克少将宣称:
"2023年论坛科工议程的主导议题涵盖AI、国防工业复合体多元化、最先进指挥控制系统、侦察体系、精确制导武器与机器人技术。无人机议题(及AI应用)获重点关注……实质上,我们正在见证一个新兴资本与技术密集型产业的诞生。大量此类项目与解决方案……正被成功整合至参与特别军事行动的俄军作战体系。"(俄新社,2023年8月15日)
鉴于战场直面西方AI技术的挫败经验,俄国防部正整合资源试图追赶西方竞争对手。关键举措包括2022年8月成立专门机构,其职能聚焦"武器装备生产中的AI能力开发"(塔斯社,2022年8月17日)。至2023年8月,俄国防部宣布推进超500项AI相关项目,其中222项将于当年底完成部署(《红星周刊》,2022年9月23日;俄新社,2023年8月15日)。此外,俄罗斯通过委托"时代"军事科技城、俄罗斯电子股份公司与联合航空制造集团等企业,构建军用AI研发体系(Cnews.ru,2019年7月11日;《红星周刊》,2021年4月19日;Vz.ru,2024年1月19日)。
2023年,俄军事专家系统分析AI赋能战场效能的重点领域,涵盖指挥控制、先制能力开发、战场态势图生成、作战建模、威胁预测、行政规划与战场监控(Cyberleninka.ru,2024年2月20日访问)。AI应用将大幅优化战前准备与实战指挥控制系统效能。俄乌战争进程进一步印证AI作为战争要素的战略价值。据俄方消息,俄军持续在"铠甲"S-1、S-300、S-400及2019年列装的S-350"勇士"中程防空系统中应用AI技术。尽管信息源存俄方主观性,但该策略对抗击美制ATACMS导弹与英法"风暴阴影"/SCALP-EG导弹显现成效(Topwar.ru,2024年7月4日)。
俄方亦加速无人机AI技术研发。据俄防空博物馆馆长、军事专家尤里·克努托夫透露,俄罗斯正为2019年首展的"扎拉柳叶刀"游荡弹药集成AI技术,使其具备"从多独立发射平台齐射无人机群,升空后通过信息交互自主分配任务"的能力(MK.ru,2024年1月3日)。
评估俄罗斯AI军事优先战略的初期成效可见,俄方正着力推动"军事AI应用常态化"。最新研究显示,俄媒涉及AI的报道中83%呈正面基调,仅17%为负面(RUND大学,2024年)。研究指出,鉴于"北约威胁迫近与军备竞赛升级",俄媒存在"为军事AI应用正名的显著趋势",总体而言"俄罗斯舆论已呈现AI军事应用常态化态势"(RUND大学,2024年)。
尽管俄罗斯在AI领域的起步较晚,其企业实力逊于北美与中国同行,但表象可能具有误导性。自全面侵乌以来,莫斯科对AI(涵盖军事与民用)的重视显著提升。最新数据显示,俄罗斯现已成为全球AI整合度前十国家之一,其在公共生活与经济各领域的渗透率居于前列(Lenta.ru,2024年3月13日)。
然而,俄军事专家(如军事科学院高级研究员弗拉基米尔·普里赫瓦季洛夫)坦言:"当前我们几乎无望在AI应用上赶超中美,技术能力存在代差"(Lenta.ru,2024年1月16日)。但三大因素可能缩小差距:其一,俄乌战争为俄罗斯提供了实战环境下AI应用的独特数据池;其二,威权体制赋予俄快速动员内部资源实现特定目标的能力,使克里姆林宫在AI资源分配上具备决策效率优势;其三,俄罗斯与委内瑞拉等威权国家开展AI合作,创造技术协同进步机遇。鉴于俄朝军事安全合作强化,双方或拓展至AI领域。
尽管俄朝在AI等创新领域的合作本身不构成直接威胁,但在网络间谍活动升级的背景下,此类协作可能催生新型风险。
最终,俄罗斯对军事AI应用的日益重视凸显其弥合技术鸿沟(尤其对美)的决心。无论能否全面追平全球AI发展,俄方依托战场经验与战略联盟强化的AI能力,或将重塑未来军事格局与冲突形态。
参考来源:jamestown