过去十年来,高超音速技术已成为与现代战争有关的讨论最多的发展之一。目前,大多数主要军事强国都在为战术和战略用途积极开发高超音速技术。

界定高超音速武器到底是什么很重要,因为在市场营销和政治目的方面,这个词有被过度使用的趋势。一般来说,高超音速武器通常被定义为速度超过 5 马赫(音速的五倍)的武器。然而,这个定义过于宽泛,因为它还包括其他各种弹药,如常规弹道导弹,它们在飞行的大气层外部分达到高超音速。因此,该术语通常用于能够在大气层内高度保持高超音速,并能以这种速度进行机动的武器。这些武器大多分为两个主要阵营--高超音速滑翔飞行器(HGV)和高超音速巡航导弹(HCM)。

俄罗斯

多年来,俄罗斯、中国和美国一直致力于开发高超音速滑翔飞行器(HGV),以增强其战略能力。值得注意的是,俄罗斯已经有多达 18 辆 Avangard高超音速滑翔飞行器在第 13 奥伦堡火箭师服役,部署为三个团。

Avangard系统集成了 UR-100N UTTKh 井基液体推进洲际弹道导弹(北约分类:SS-19 Mod 3 Stiletto)和新型高超音速滑翔运载火箭,公开资料此前称其为 ”Object 4202 “和 ”15Yu71"。据报道,该滑翔飞行器由 NPO Mashinostroyenia 开发,已进行了至少 7 次测试,最近一次是在 2018 年 12 月 26 日。与洲际弹道导弹使用的传统重返大气层飞行器不同,Avangard HGV提前重返大气层,并从弹道轨迹过渡到滑翔轨迹。据报道,再入大气层时,其速度可达 27 马赫,与传统洲际弹道导弹弹头类似,但在漫长的滑翔阶段,由于大气阻力的影响,以及飞行器自身缺乏推进力,这一速度会迅速下降。据估计,在飞行的最后阶段,其速度将降至 8-10 马赫左右。

图:UR-100N UTTKh ICMB 与 Avangard HGV 一起装入发射井。 资料来源:俄罗斯国防部

Avangard的高速度,加上其非弹道轨迹和机动性,使目前的防空和导弹防御系统难以拦截。此外,Avangard导弹的飞行轨迹可控,因此有可能实现更精确的目标定位,从而使未来常规精确制导洲际弹头的部署成为可能。

一个耐人寻味的方面是亚斯年斯克发射场是如何装备 UR-100N UTTKh 的,因为最后 30 枚现役的该型导弹都部署在远离亚斯年斯克市的萨拉托夫州塔蒂什切夫发射场。最初,迁移重型液体推进洲际弹道导弹的想法似乎不切实际。然而,俄罗斯似乎在 2002-2004 年间从乌克兰获得了 30 枚库存的Stilettos洲际弹道导弹。这些洲际弹道导弹的状况良好,至少可以使用到 2020 年及以后。其中有 12-20 枚导弹被改装成Avangard导弹,储存在 R-36M2 型洲际弹道导弹的空发射井中。

目前,Avangard导弹被视为一种临时的过渡性解决方案。UR-100N UTTKh 于 1985 年停止生产,已经老旧,寿命有限。未来可能由 RS-28 Sarmat 重型洲际弹道导弹作为 HGV 的载体。2023 年 9 月 1 日,俄罗斯塔斯社援引俄罗斯宇航局局长尤里-鲍里索夫的话说,Sarmat已进入俄罗斯武装部队服役。由于Sarmat的有效载荷能力较高(是 UR-100N 的两倍),它有可能同时搭载两到三架滑翔机。不过,即使 RS-28 得到更广泛的部署,也只有少数可能配备高超音速滑翔机;其余将携带常规核弹头,因为常规核弹头既便宜又轻便--RS-28 至少可以携带 10 枚核弹头。

鉴于现阶段反弹道导弹(ABM)系统的发展情况,大规模生产和部署携带核弹头的高超音速滑翔机被认为是不切实际的。它们比标准重返大气层运载工具更大、更重、更昂贵,而且携带的弹头数量也会减少。在遥远的未来,能够在 30 分钟内击中全球目标的常规高超音速滑翔机可能更有价值,但俄罗斯国防工业尚未准备好生产如此高精度所需的复杂制导系统。

已知唯一服役的高超音速导弹是俄罗斯的 3M22 “锆石”(有时也写作 “Tsirkon”),该导弹甚至在乌克兰战争中使用过。有关该导弹的可靠信息仍然很少,即使是简短的发射视频记录也没有透露太多信息。可以确定的是,导弹从 3S14 垂直发射装置发射后,由固体推进剂助推器加速到启动冲压喷气发动机或扰动喷气发动机所需的超音速。鉴于该导弹能够达到 8 马赫的速度,因此很可能采用了扰流喷气发动机。但也有观点认为,“锆石 ”的巡航速度可能接近 4-5 马赫(超音速),在飞行过程中通过启动火箭发动机进一步加速,从而达到高超音速。锆石 "的航程估计在 600 公里左右。目前,该导弹有潜艇版和舰艇版,一些信息表明可能会开发陆基版。据认为,“锆石 ”导弹的制导系统至少有两种版本--一种是用于反舰的主动雷达寻的器变体,另一种是用于攻击地面目标的全球导航卫星系统(GNSS)和惯性导航系统(INS)联合制导变体。

图:米格-31K 飞机上的 Kinzhal 导弹。 图片来源:俄罗斯联邦总统办公室

俄罗斯武库中的另一种实用高超音速武器是Kinzhal。尽管Kinzhal导弹被认为不是 “真正的 ”高超音速武器,因为它既不是HGV,也不是HCM,而是一种基于 “伊斯坎德尔-M ”短程弹道导弹(SRBM)系统的9M723导弹的气动弹道导弹。将现有的 9M723 导弹改装为空射导弹是一个合理的举措,因为它所需的投资相对较少,但却能完成关键任务:精确打击受分层防空和导弹防御系统保护的敌方关键目标。该导弹的最大射程仍有争议,但据一次试射的官方报告证实,其最大射程至少为 1000 公里。该导弹的速度达到 10 马赫,大大缩短了与目标交战的时间,为俄罗斯武装部队在各种冲突中提供了强有力的远程工具。在平均速度为 7 马赫的情况下,导弹只需 6 分钟就能到达 1000 公里以外的目标。Kinzhal在俄乌战争中的应用有限,但它是众所周知的难以拦截的目标。与此同时,Kinzhal导弹无懈可击的神话也在很大程度上破灭了,因为已知有导弹被 “爱国者 ”PAC-2 地对空防空导弹拦截的案例,尽管该导弹具有很高的末端速度并使用了穿透辅助装置(这在战术导弹中相对罕见)。目前,Kinzhal导弹的唯一载体是经过改装的米格-31K 飞机,但有关改装该导弹供图-22M3 远程轰炸机携带的讨论仍在进行中。

俄罗斯还有一些其他项目正在筹备中,如 GZUR HCM 和 Klevok-D2 高超音速火炮火箭。然而,在乌克兰战争的背景下,这些项目的实用性值得怀疑,很可能会减缓其发展速度,因为在资金方面,更紧迫的军事优先事项将被优先考虑。

GZUR(一些消息来源称该项目名为 “Gremlin”)是一种 HCM,最大飞行速度为 6 马赫,射程超过 1000 公里。有关该项目的信息相对较少,据推测,GZUR 比 “锆石 ”更轻、更紧凑。据了解,Klevok-D2 是一种相对较轻的火炮火箭,射程约 100 公里,速度约 5 马赫,以Hermes战术导弹为基础。鉴于 Hermes已经面临的问题,现在评估 Klevok-D2 的前景和能力还为时过早。

美国

美国在高超音速领域的项目包括著名的先进高超音速武器(AHW)和高超音速技术飞行器 2(HTV-2)。自 2006 年以来,大约 1 亿美元的预算资金分配给了 AHW,而 HTV-2 自 2008 年以来花费了美国纳税人大约 3.25 亿美元。创建飞行试验台、一次部分成功的试验和三次不成功的试验总共花费了 4.25 亿美元。这是一笔不小的开支,特别是考虑到 “免费 ”运载火箭,如 “牛头怪 ”IV 和 STARS IV(分别是退役的 IBM LGM-118A “和平卫士 ”和 UGM-27 “北极星 ”的特殊改型)已被用于发射。这些项目最初都是试验性质的。

图:已部署的 LRHW 炮台的 CG 效果图,包括四个 TEL。 资料来源:洛克希德-马丁公司

自 2019 年以来,美国国防部(DoD)已在高超音速导弹研发项目上投入了超过 80 亿美元。这些计划包括陆军、海军和空军为制造高超音速助推滑翔导弹所做的独立努力。此外,DARPA、空军和海军还开展了合作项目,重点研究高超音速导弹。有关导弹组件的各种研究计划也是这项广泛投资的一部分。

目前,美国在高超音速飞行器领域有两个实际研发项目,分别由美国陆军和美国海军实施,美国空军也有一个可疑的实际项目。通用高超音速滑翔弹体(C-HGB)是 AHW 的进一步发展,成为陆军远程高超音速武器(LRHW,又称 “暗鹰”)、海军中程常规快速打击武器(IR-CPS)和美国空军已取消的高超音速常规打击武器(HCSW,读作 “Hacksaw”)的基础。另一方面,HTV-2 成为战术助推滑翔(TBG)的基础,由此产生了美国空军的 AGM-183 空射快速反应武器(ARRW,读作 “箭”)计划,该计划目前处于不确定状态,有迹象表明该计划将于 2023 年取消。然而,在 2024 年的进一步测试之后,其最终命运仍不完全明朗。

美陆军的 LRHW 助推-滑翔导弹设计为使用移动式运输-发射装置(TEL)从地面发射。一个 LRHW 炮台将包括四台 TEL、八枚导弹和一个操作中心。虽然 LRHW 的大部分性能特征都是保密的,但据公开披露,其射程超过 2,775 千米。LRHW 计划已成功完成了一枚原型导弹的飞行试验,但近年来也遇到过试验失败的情况。计划在 2028 年之前与海军合作再进行几次飞行试验。陆军最初的计划是在 2023 年部署首批 LRHW 导弹原型,预计在 2025 年和 2027 年再部署两个炮台组。然而,由于试验失败,初期能力的部署推迟到了 2025 年。

图:从海军平台发射中程常规快速打击导弹的效果图。 资料来源:洛克希德-马丁公司 海军的 IR-CPS 助推-滑翔导弹

美海军的 IR-CPS 助推滑翔导弹实际上是 LRHW 的海上发射变体,同样携带 C-HGB。最初,海军计划在 “弗吉尼亚 ”级核动力潜艇上部署 IR-CPS,使用 “弗吉尼亚 ”有效载荷模块--一种为这些潜艇的新型号设计的多导弹发射器。为了加快部署速度,海军现在计划首先在现有的祖姆沃尔特级驱逐舰上部署红外发射系统,然后再开发弗吉尼亚级潜艇的发射能力。虽然 IR-CPS 的规格是保密的,但其射程预计将与陆军的 LRHW 类似,超过 2775 千米。由于多种原因,海军版助推滑翔导弹的研制时间预计将长于陆军版。最初,IR-CPS 的开发与 “弗吉尼亚 ”有效载荷模块的时间挂钩。此外,从潜艇发射导弹需要进行 “冷发射”,即在点燃火箭发动机之前,先用气体发生器将导弹从发射管中弹出。这一过程比陆军 LRHW 等地面发射导弹所采用的 “热发射 ”更为复杂,后者是导弹在发射时点燃火箭发动机,并依靠自身动力将自身推出发射装置。海军计划于 2025 年在 “祖姆沃尔特 ”级驱逐舰上部署具备初始能力的 IR-CPS 导弹,并于 2028 年在 “弗吉尼亚 ”级潜艇上部署具备全面能力的导弹。

美国空军的 ARRW HGV 由洛克希德-马丁公司研制,计划从 B-52 轰炸机上发射,也可能计划使用其他发射平台,如 B-1 轰炸机。到目前为止,美国空军已经披露了该导弹的一些技术细节,包括它的射程至少为 926 千米,其助推器由一个基于 ATACMS 导弹的单级固体火箭发动机组成。美国空军明确表示,该计划将于 2023 年取消。但不久之后,它又表示该计划的命运将在 2024 年的最后一次试验中决定。ARRW 的最后一次试射于 2024 年 3 月 17 日进行,但在撰写本报告时,仍不清楚这次试射是否成功,以及 ARRW 的进一步发展计划(如果有的话)。

图:B-52 战略轰炸机上的 AGM-183 ARRW。 资料来源:美国空军/Christopher Okula

美国在 “作战火力”(OpFires)项目上也做出了进一步的努力。该系统的开发始于 2017 年,是 DARPA 和美国陆军联合计划的一部分。虽然滑翔飞行器的正式射程尚未公布,但作为一种中程武器,它的射程估计在1600-1800千米左右。这实际上意味着它的射程低于 LRHW,而且在概念上成本更低,数量更多。OpFires 系统采用两级固体燃料助推器设计,计划使用与 ARRW 相同的 TBG 衍生 HGV。据说该武器的速度超过了 5 马赫,非官方消息称滑翔飞行器的速度在 6.5 至 8 马赫之间。尽管 2022 年至少成功进行了一次飞行试验,但有关该计划现状的信息相对较少。

在美国高超音速飞行器计划方面,自 2014 年以来,DARPA 一直在资助高超音速喷气式武器概念(HAWC)计划下的扰频喷气发动机研究。作为这些研究工作的成果,美国空军和美国海军正在分别研究高超音速攻击巡航导弹(HACM)和进攻性反水面战(OASuW)增量2,即通常所说的高超音速空射反水面战(HALO)计划。目前,公开资料中有关这两个项目的具体信息非常有限。

图:在 2022 年进行的首次 “作战火力 ”试射中,导弹离开了发射筒,据报道这次试射取得了成功。 资料来源:DARPA

美国空军计划在 2024 年 10 月至 2027 年 3 月期间对高超音速攻击巡航导弹(HACM)进行 13 次测试。如果项目证明成功,将随后决定生产。雷神公司是 HACM 的主承包商,诺斯罗普-格鲁曼公司则负责开发其喷气发动机。人们对 OASuW Inc 2 计划的进展知之甚少,该计划旨在开发一种配备扰频式喷气发动机的反舰巡航导弹。尽管 “光环 ”的名称中包含 “高超音速”,但官员们表示它不一定能达到这样的速度。据海军航空系统司令部无人航空和攻击武器项目执行官斯蒂芬-特德福德海军少将称,“光环 ”的 “峰值速度 ”可能会达到 “4马赫以上”。目前,美国海军正在为 “光环 ”的研究、开发、测试和评估寻求更多资金。

中国和其他国家

中国在 HGV 方面的工作一直以相当保密的方式进行。大部分可用信息都是基于美国情报机构提供的信息,因此很难进行详细分析。一些美国消息来源甚至认为中国目前是 “高超音速竞赛 ”的领跑者。

目前已知的是,中国从 2014 年开始对 DF-ZF HGV 进行了多次测试,该系统可能从 2019 年开始投入使用。DF-ZF 滑翔机被用作 DF-17 中程弹道导弹(MRBM)的弹头运载组件,射程估计在 1800-2500 公里左右。据了解,该系统具有反舰用途,可携带常规弹头或核弹头。中国的另一种弹道导弹是 DF-27,它也被认为使用 HGV 作为弹头组件。据推测,其射程约为 5000-8000 千米,也可能用于反舰。从技术上讲,DF-ZF 也有可能与中国的其他洲际弹道导弹一起使用,如 DF-31 或 DF-41。

有关中国高超音速飞行器的信息相对较少,而有关中国其他高超音速飞行器(如高超音速导弹)的信息则更少。不过,中国很可能至少正在此类方向上开展一些高度保密的工作。

据悉,法国和印度也在进行一些试验性高超音速飞行器测试,分别是 V-MAX 和达瓦尼项目。不过,目前这些计划远远落后于中国、俄罗斯和美国的同类计划。在高超音速领域的其他努力方面,法国正在研制核弹头空射高超音速导弹(ASN4G),作为法国仍在研制中的 “ASMPA-R”(Air-Sol Moyenne Portée Amélioré-Rénové)的最终继承者。ASN4G 计划在 2030 年后成为法国机载核威慑力量的一部分,由阵风战斗机携带。

结束语

高超音速技术仍然是人们关注的焦点,中国、俄罗斯和美国等国被认为是开发和部署这些技术的领头羊。中国和俄罗斯率先部署了高超音速能力,这在很大程度上是因为它们优先考虑了高超音速能力的重要性,并采取了较为简单的方法来发展高超音速能力。例如,俄罗斯在开发Kinzhal导弹时,将 “伊斯坎德尔-M ”SRBM改装成气弹道导弹,显示了灵活性。

而美国则采取了更为复杂的方法,例如开发能够使用常规弹头进行远程精确打击的 HGV。尽管如此,从长远来看,美国正在投入时间和资源的常规高超音速打击能力有可能在现实战场上改变游戏规则。虽然Avangard等具备核能力的系统可提供战略威慑能力,但人们普遍希望永远不要使用这类武器。相比之下,美国的努力集中在更有可能实际使用的武器上。

参考来源:欧洲安全与防务杂志

成为VIP会员查看完整内容
4

本文旨在研究天基激光武器系统对抗高超音速滑翔飞行器的有效性。高超音速滑翔飞行器是一种新兴的武器系统,兼具弹道导弹的射程和巡航导弹的机动性。这些系统对军事资产构成了独特的威胁,不仅因为其能力扩大,还因为缺乏有效的防御对策。天基激光武器系统可为这一问题提供解决方案。本文首先模拟了天基激光系统抵御高超音速滑翔飞行器的动力学过程。在假定点质量三自由度条件下,定义了两个物体的空间轨道力学和大气飞行力学的支配运动方程。交战模型中的几个变量允许变化,包括天基激光系统的真实异常和上升节点的赤经的初始条件,以及高超音速滑翔飞行器的速度比、攻击角和地面目标的航向。每个物体的运动从初始条件开始向前传播,分析视线沿线的相对运动和激光。然后将激光的预定拦截范围与高超音速滑翔飞行器的飞行路径进行比较,以确定何时成功拦截高超音速滑翔飞行器。最后,研究激光拦截高超音速滑翔飞行器的解集。结果表明,确实存在可用的解决方案集,天基激光系统可以防御高超音速滑翔飞行器对特定地面目标的攻击。

成为VIP会员查看完整内容
8

第五代移动网络(5G)有望通过增强移动宽带、减少延迟和支持大规模物联网(IoT)部署,大幅提高联网通信和传感设备的能力。加拿大国防研究与发展部(DRDC)已着手开展一项 5G/IoT 项目活动(PAct),以探索将该技术用于军事应用的可能性。该活动的一部分将要求建造一个实验室,以便对 5G 和物联网无线网络的能力和脆弱性进行研究和实验。

本科学报告简要回顾了 5G/IoT 标准和技术,并确定了 5G/IoT 应用的潜在军事要求。报告介绍了四个 5G/IoT 场景,以启发 5G/IoT 实验室实例的设计和实施,并分析了现有架构/框架对这些场景的适用性。最后,报告详细描述了在 DRDC - 渥太华研究中心建立内部 5G/IoT 实验室的实验室架构。

北约和 “五眼”(FVEY)社区的军事和国防组织正在积极调查 5G 和物联网无线技术的潜在军事和国防应用。为了向国防部(DND)和加拿大武装部队(CAF)提供指导和建议,帮助其在未来网络中更好地利用和保护该技术,DRDC - 渥太华研究中心计划建立一个现场 5G/IoT 无线实验室,用于实验、演示和合作。本报告对当前的 5G/IoT 技术进行了必要的背景介绍和分析,以便开发该实验室。创新战略与概念总监 (DISC) 和网络任务保障计划开发团队都对本报告感兴趣,前者是描述 DRDC 即将建立的实验室能力的基石,后者则是为将 5G 和/或物联网实验室组件纳入其网络任务保障实验室 (CMAL) 资本项目提供想法和考虑因素。

本报告旨在作为一个自成一体的资源,不仅提供 DRDC 内部 5G/IoT 实验室的愿景,还提供推进这一愿景的技术背景和必要分析。本报告的其余部分安排如下:

  • 第 2 部分概述了 5G 和物联网技术。本节讨论了这些技术的历史和演变,并回顾了相关标准和实施架构。本节对于希望更好地了解 5G 和物联网系统如何工作的读者很有价值。

  • 第 3 节提供了 5G/IoT 技术的激励性用例和场景。这些灵感来源于以前的工作[5]、[6]和[7],并为需要在实验室开发的技术类型提供了启发。本节对所有读者都有价值。

  • 第 4 节至第 7 节基于对现有标准、模型和可用技术的详细分析,深入探讨了如何架构、设计和构建 5G/IoT 实验室。每个章节(和小节)最后都有一个 “实验室的主要启示”;寻求高层次 “底线 ”的读者可以跳到每个小节中的主要启示,而对得出这些结论的分析感兴趣的研究人员则可以阅读相关小节:

    • 第 4 节根据第 3 节中制定的方案,确定了实验室系统的高层次特征/功能;

    • 第 5 节提出了系统架构,研究了系统中各网络层的作用(受开放系统互连网络模型的启发);

    • 第 6 节探讨相关的实施和后勤考虑因素;以及

    • 第 7 节讨论了提供 5G/IoT 技术的现有商业和开源替代方案的优点。

  • 最后,第 8 节对本报告进行了简要总结。

成为VIP会员查看完整内容
3

雾计算平台微服务框架(FCP-MF)是一个高级应用编程接口(API),允许开发人员轻松快速地构建与雾计算平台(FCP)兼容的微服务。它允许开发人员专注于微服务功能,而不必担心发送和接收消息以处理、配置、加密和日志格式化等较低级别的细节,这些细节对于运行良好的微服务至关重要,但却会分散微服务核心实施的注意力。

目前,FCP-MF 是作为基于 Python 的微服务的抽象 Python 实现而开发的,但可以扩展到 Java 和 C/C++ 等其他语言。

图 1 描述了 FCP 的概念架构以及微服务和代理之间的发布和订阅任务。

图中显示了两种类型的终端用户。左边的终端用户代表客户端应用程序的用户,该应用程序使用来自边缘和雾的数据。该应用程序监听数据,以某种方式处理数据,并将数据格式化供用户查看。右侧的终端用户是 SmartFog 管理员,负责从云端部署和管理微服务。

消息队列遥测传输(MQTT)是一种消息代理技术,可使微服务之间以及边缘层与云层之间进行通信。不过,也可以使用类似的经纪人,如高级消息队列协议。虽然每个设备不需要自己的 MQTT 代理,但必须能访问代理;因此,每个 FCP 部署必须包括至少一个消息代理服务器。

成为VIP会员查看完整内容
2

定向能(DE)武器使用集中的电磁能而非动能来打击敌军。尽管美国从 20 世纪 60 年代起就开始研究定向能,但一些专家指出,美国国防部(DOD)在定向能项目上投入了数十亿美元,但这些项目未能达到成熟阶段,最终被取消。不过,近年来国防部在定向能武器研发方面取得了进展,并于2014年在美国海军庞塞号战舰上部署了美国首枚实用定向能武器。从那时起,定向能武器的开发一直在继续,国防部发布了定向能路线图,以协调该部门的工作。国防部还提出了 “高能激光缩放计划”,旨在加强定向能武器的国防工业基础,提高激光束的质量和效率。

本报告为国会提供了有关高能激光(HELs)和高功率微波(HPM)武器等 DE 武器的背景信息和问题,并概述了部分未分类的国防部、空军、陆军和海军 DE 项目。如果成功投入实战,地面部队可在一系列任务中使用激光,包括短程防空(SHORAD)、反无人机系统(C-UAS)和反火箭、火炮和迫击炮(C-RAM)任务。HPM 武器可提供一种使对手电子和通信系统失效的非动能手段。与传统弹药相比,定向能武器可降低后勤需求,降低每次发射的成本,并且(假设有足够的电力供应)可提供更深的弹仓。不过,这些武器可能面临动能武器所没有的限制。例如,大气条件(如雨、雾、遮蔽物)可能会限制 DE 武器的射程和光束质量,从而降低其有效性。

在美国防部继续投资定向能武器时,国会可能会考虑武器的技术成熟度、生命周期成本、特性、任务效用、工业基础、情报需求和监督结构。国会还可以考虑 DE 武器对未来军备控制协议的影响。

图 2. 美国防部定向能路线图概要

美国防部定向能计划由国防部研究与工程副部长办公室(OUSD[R&E])定向能首席主任负责协调。定向能首席主任负责制定和监督定向能路线图,该路线图阐明了国防部的目标,即 “在定向能军事应用的每项任务和领域中取得优势”。据 OUSD(R&E)称,当前的路线图概述了国防部的计划,即在 2025 财政年度之前,将 HEL 武器的功率水平从目前可行的 150 千瓦(kW)左右提高到 500 千瓦级别,同时减小尺寸和重量。国防部寻求 “进一步减小尺寸和重量,到 2026 财年将功率提高到 MW [兆瓦] 级”。作为参考,尽管对于消除不同目标集所需的精确功率水平尚未达成共识,但国防部简报文件(见图 2)表明,约 100 千瓦的激光器可攻击无人机系统、火箭、火炮和迫击炮,而约 300 千瓦的激光器还可攻击以特定剖面飞行的小船和巡航导弹(即横着而不是对着激光器飞行)。1 兆瓦的激光器有可能使弹道导弹和高超音速武器失效。

图 9. 美海军激光器开发路线图

成为VIP会员查看完整内容
4

国际机器学习大会(International Conference on Machine Learning,简称ICML)是机器学习领域的顶级会议。7月21日至27日,ICML 2024在奥地利维也纳正式召开。自动化所多篇研究论文被本届会议录用,部分论文当选Spotlight Paper(仅占总投稿量的3.5%)。本文将对相关成果进行介绍,欢迎交流讨论。

**1. **具有O(L)训练和O(1)推理复杂度的时间可逆脉冲神经网络

High-Performance Temporal Reversible Spiking Neural Networks with O(L) Training Memory and O(1) Inference Cost 论文作者:胡珈魁、姚满、邱雪睿、侴雨宏、蔡宇轩、乔宁、田永鸿、徐波、李国齐 本研究入选Spotlight Paper

利用多时间步进行仿真的脉冲神经网络(SNNs)训练显存高,且能耗高。当前的方法无法同时解决这一训练和推理难题。该研究提出一种时间可逆架构,通过改变SNNs的前向传播路径,同时应对训练和推理挑战。该研究关闭大部分脉冲神经元的时间动态,并对开启时间动态的脉冲神经元处设计多级时间可逆交互,从而实现O(L)的训练需求。结合时间可逆特性,重新设计SNNs的输入编码和网络组织结构,实现了O(1)推理能耗。实验结果验证了所提出的方法在不损失性能的前提下,能同时大幅度提升训练效率和推理效率。

时间可逆脉冲神经网络

**2. **鲁棒的偏好强化学习算法

RIME: Robust Preference-based Reinforcement Learning with Noisy Preferences 论文作者:程杰,熊刚,戴星源,缪青海,吕宜生,王飞跃 ★ 本研究入选****Spotlight Paper

强化学习的成功通常需要选择合适的奖励函数,这一过程费时费力、且依赖于手工设计。而偏好强化学习(PbRL)方法利用人类偏好来学习奖励函数,从而规避了该过程。相较于其他领域而言,控制任务需要更高质量的人类反馈数据;同时,现有算法过度追求反馈利用率,期望用更少的反馈数据来获得更好的控制性能,这进一步恶化了算法在面对噪声数据时的性能。 为此,本文提出了RIME,一种对含有噪声的偏好数据鲁棒的PbRL算法,可从带噪偏好中进行有效的奖励和策略学习。具体而言,基于干净偏好数据的损失上界假设,理论分析了错误样本的KL散度下界,并进一步对RL训练中的分布偏移情况进行不确定性补偿,从而动态地过滤噪声偏好数据。为了抵消因错误筛选而导致的累积误差,本文通过热启动奖励模型,使其在预训练阶段拟合自驱奖励。同时,本文发现奖励模型的热启动还可以弥补 PbRL 从预训练到在线训练切换时产生的性能鸿沟。在机器人操作(Meta-World)和运动(DMControl)任务上的实验表明,RIME 显著增强了PbRL方法的鲁棒性。

论文链接:https://arxiv.org/abs/2402.17257代码链接:https://github.com/CJReinforce/RIME_ICML2024

**3. **HGCN2SP:基于层次化图卷积网络的两阶段随机规划

HGCN2SP: Hierarchical Graph Convolutional Network for Two-Stage Stochastic Programming

论文作者:吴洋,张一帆,梁振兴,程健 两阶段随机规划(Two-Stage Stochastic Programming, 2SP)是建模和求解不确定性下决策问题的有效方法。在这种情况下,决策者需要在不确定未来环境的情况下,先做出第一阶段的决策,然后根据实际发生的情况(场景)制定具体的第二阶段决策,以最小化总成本或最大化总收益。然而,随着场景数量的增加,问题规模迅速膨胀,导致求解时间显著增加。因此,如何高效求解成为了亟待解决的关键问题。 我们提出了HGCN2SP模型,该模型利用层次化图卷积网络提取场景的表征,采用基于注意力机制的解码器挑选代表性的场景,并结合强化学习(RL)优化其选择,实现了2SP问题的高效求解。在设施选址问题上的实验表明,HGCN2SP能够做出比现有方法更优的决策。在网络设计问题的实验中,HGCN2SP仅用不到一半的时间就取得了相近的决策效果。尤其在大规模实例和大量场景的情况下,HGCN2SP依然保持了强大的泛化能力。

**4. **迈向高效脉冲Transformer:一种用于训练和推理加速的令牌稀疏化框架

Towards Efficient Spiking Transformer: A Token Sparsification Framework for Training and Inference Acceleration 论文作者:诸葛正阳,王培松,姚星廷,程健 当前的脉冲Transformer在具有脉冲神经网络能效优势的同时,还展现出了逼近人工神经网络的卓越性能。然而,虽然能通过神经形态计算实现能耗高效的推理过程,但脉冲Transformer在GPU上的训练过程相比于人工神经网络需要消耗更多时间。 为了解决该问题,我们探索了针对高效脉冲Transformer的令牌稀疏化方案,并发现传统稀疏化方法存在明显的性能下降问题。我们对此问题进行了分析并提出了基于时间步锚定令牌与双对齐的稀疏化方法(STATA),使用更加标准化的准则在时间步维度上识别重要的令牌,并通过双对齐机制促进多个维度上较弱注意力图的学习,进一步保证了令牌稀疏化的准确性。实验结果表明,STATA在脉冲Transformer的训练和推理过程显著优于传统的稀疏化方法。它在保持了一定模型性能的基础上,实现了约1.53倍的训练提速和48%的推理能耗节省,同时它还在多种数据集和架构上具有较好的可迁移性。

**5. **揭示极大卷积核网络鲁棒性的秘密

Revealing the Dark Secrets of Extremely Large Kernel ConvNets On Robustness 论文作者:陈宏昊,张育荣,丰效坤,初祥祥,黄凯奇 部署深度学习模型时,鲁棒性是一个需要考虑的重要方面。许多研究致力于研究视觉转换器(ViTs)的鲁棒性,因为自20世纪20年代初以来,ViTs一直是视觉任务的主流骨干选择。最近,一些大卷积核网络以令人印象深刻的性能和效率卷土重来。然而,目前尚不清楚大卷积核网络是否具有强鲁棒性及影响其鲁棒性的因素。 在本文中,我们首先在六个不同的鲁棒性基准数据集上对大核卷积的鲁棒性及其与典型的小核卷积和ViTs的差异进行了全面评估。然后,为了分析其强大鲁棒性背后的潜在因素,我们从定量和定性的角度设计了九组实验,以揭示大核卷积网络与传统卷积网络完全不同的有趣特性。我们的实验首次证明,纯卷积网络可以实现与ViTs相当甚至优于ViTs的优异鲁棒性。我们对遮挡不变性、核注意力模式和频率特性的分析为鲁棒性的来源提供了新的见解。

**6. **Libra:基于解耦视觉系统的多模态大语言模型

Libra: Building Decoupled Vision System on Large Language Models

论文作者:许逸凡,杨小汕,宋亚光,徐常胜 本工作提出了一个基于解耦视觉系统的多模态大语言模型Libra。解耦视觉系统将视觉建模解耦成内部模态建模和跨模态交互两部分,使得模型能够在保留视觉独有信息的同时进行有效的跨模态理解。Libra对于视觉和语言模态采用了统一的自回归建模。具体来说,本工作在已有大语言模型基础上,嵌入了路由视觉专家,在模型的注意力计算过程中将视觉和语言流进行路由,从而使得模型在模态内部建模和跨模态交互的计算情境下呈现出不同的注意力计算模式。实验表明Libra的这种结构设计能够在仅用5千万图文对的训练数据量下取得和现有多模态大模型相匹敌的性能。因此,本工作为未来多模态基础模型提供了一个新的设计角度。

**7. **基于快-慢测试时自适应的在线视觉-语言导航方法

Fast-Slow Test-time Adaptation for Online Vision-and-Language Navigation

论文作者:高君宇,姚暄,徐常胜 视觉-语言导航作为实现具身智能的关键研究方向,专注于探索智能体如何准确理解自然语言指令并导航至目标位置。在实际中,智能体通常需要以在线的方式执行视觉-语言导航任务,即完成跨样本的在线指令执行和单样本内的多步动作决策。由于仅依赖预训练和固定的导航模型难以满足多样化的测试环境,这促使我们探索如何利用未标注的测试样本来实现有效的在线模型适应。然而,过于频繁的模型更新可能导致模型参数发生显著变化,而偶尔的更新又可能使模型难以适应动态变化的环境。 为此,本文提出了一种新的快-慢测试时自适应方法(FSTTA),该方法在统一框架下对模型梯度和参数进行联合的分解与累积分析,以应对在线视觉语言导航任务的挑战。通过大量实验验证,本文提出的方法在四个流行的基准测试中均取得了显著的性能提升。

模型的整体架构

论文链接: https://icml.cc/virtual/2024/poster/33723 代码链接: https://github.com/Feliciaxyao/ICML2024-FSTTA

**8. **Transformer不同子层的差异化结构压缩

LoRAP: Transformer Sub-Layers Deserve Differentiated Structured Compression for Large Language Models 论文作者:李广焱,唐永强,张文生 Transformer的结构化压缩往往采用单一的压缩方法,从而忽略了Transformer中不同子层之间的结构特性。为了解决该问题,本文设计了一种新颖的结构化压缩方法 LoRAP,它有机地结合了低秩矩阵近似和结构化剪枝。这项研究中得出了一个重要观察:多头自注意力(MHA)子层显示出明显的低秩结构,而前馈网络(FFN)子层则没有。基于这一观察,对于MHA子层,本文提出了一种输入激活加权奇异值分解方法,并根据矩阵低秩属性的差异分配不同的参数量。对于FFN子层,本文提出了一种梯度无关的结构化通道剪枝方法。在零样本困惑度和零样本任务分类的广泛评估中,本文的方法在多个压缩比下均优于之前的结构化压缩方法。

论文链接: https://arxiv.org/abs/2404.09695

**9. **连点成线:面向黑盒视觉语言模型的协作式微调

Connecting the Dots: Collaborative Fine-tuning for Black-Box Vision-Language Models 论文作者:王政博、梁坚、赫然、王子磊、谭铁牛 随着预训练视觉语言模型的不断发展,它的通用性和泛化性得到广泛认可,人们投入了大量精力对其进行微调以适应下游任务。尽管如此,这些方法通常需要访问模型的结构和参数,这可能会侵犯模型所有者的权益。因此,为了保护其模型所有权,模型拥有者往往选择将其模型以黑盒形式提供,这给模型微调带来了挑战。 本文提出了一种名为协作式微调(CraFT)的新方法,用于在黑盒条件下微调视觉语言模型以适应各种下游任务。该方法仅依赖于模型的输入提示和输出预测结果。CraFT设计两个关键模块:一个提示生成模块,用于自动学习最有效的文本提示;一个预测优化模块,通过增强残差来优化输出预测。此外,我们引入了一种辅助的预测一致性损失,以促进这些模块之间的一致优化。所有这些模块通过一种新颖的协作训练算法进行优化。 通过大量的实验验证,无需模型的结构、参数及梯度,CraFT能够在保持微调效率的前提下大幅提升黑盒模型在下游任务的性能。 黑盒协同微调方法示意图 论文链接:https://arxiv.org/abs/2402.04050代码链接:https://github.com/mrflogs/CraFT

**10. **词元级别直接偏好优化

Token-level Direct Preference Optimization 论文作者:曾勇程,刘国庆,马纬彧,杨宁,张海峰,汪军 在人工智能领域的发展过程中,对大语言模型(LLM)的控制与指导始终是核心挑战之一,旨在确保这些模型既强大又安全地服务于人类社会。直接偏好优化方法(DPO)通过数学推理得到奖励函数与最优策略之间的直接映射,消除了奖励模型的训练过程,直接在偏好数据上优化策略模型,实现了从「反馈到策略」的直观飞跃。然而,DPO主要关注在逆KL散度约束下的策略优化。由于逆KL散度的mode-seeking特性,DPO在提升对齐性能方面表现出色,但是这一特性也倾向于在生成过程中减少多样性,可能限制模型的能力。另一方面,尽管DPO从句子级的角度控制KL散度,模型的生成过程本质上是逐个token进行的。从句子级控制KL散度直观上表明DPO在细粒度控制上存在限制,对KL散度的调节能力较弱,可能是DPO训练过程中LLM的生成多样性迅速下降的关键因素之一。 为了应对模型生成多样性显著下降的问题,我们的方法TDPO从token-level的角度重新定义了整个对齐流程的目标函数,并通过将Bradley-Terry模型转换为优势函数的形式,使得整个对齐流程能最终从 Token-level层面进行分析和优化。相比于 DPO而言,TDPO的主要贡献如下: * Token-level的建模方式:TDPO从Token-level的角度对问题进行了建模,对RLHF进行了更精细的分析; * 细粒度KL散度约束:在每个token处从理论上引入了前向 KL散度约束,使方法能够更好地约束模型优化; * 性能优势明显:相比于DPO而言,TDPO能够实现更好的对齐性能和生成多样性的帕累托前沿。

图 1:DPO和TDPO损失函数对比

图 2:IMDb数据集上的实验。图3(a)表示相对于参考模型的预期回报和KL散度的帕累托前沿。我们针对参数α实施了DPO、TDPO1以及TDPO2的不同版本。就帕累托前沿而言,TDPO1和TDPO2均优于DPO,其中TDPO2相对于TDPO1进一步提高了性能。这证明了我们的分析和修改的有效性。图3(b)和图3(c)分别展示了在训练步骤中,偏好和不偏好响应子集的序列KL散度的演变情况。图3(d)展示了在整个训练过程中,不偏好响应子集的序列KL散度与偏好响应子集的序列KL散度之间的差异。与TDPO1和DPO算法相比,TDPO2在KL散度的调节方面表现出了优越性。

论文地址: https://arxiv.org/abs/2404.11999 代码地址: https://github.com/Vance0124/Token-level-Direct-Preference-Optimization

**11. **基于扰动过程一致性的随机微分方程的策略梯度稳定算法

Stabilizing Policy Gradients for Stochastic Differential Equations via Consistency with Perturbation Process

论文作者:周相鑫,王亮,周钇驰 为了生成具有目标性质的样本,本研究专注于优化参数化的随机微分方程(SDEs)的深度神经网络生成模型,这是具有高表达性的先进生成模型。策略梯度是强化学习中的领先算法。然而,当将策略梯度应用于SDEs时,由于策略梯度是基于有限的轨迹集估计的,它可能是不明确的,并且在数据稀疏区域的策略行为可能是不受控制的。这一挑战妨碍了策略梯度的稳定性,并对样本复杂性产生了负面影响。 为了解决这些问题,本研究提出将SDE约束为与其相关的扰动过程一致。由于扰动过程覆盖了整个空间并且易于采样,本研究可以缓解上述问题。研究框架提供了一种通用方法,允许灵活选择策略梯度方法,以有效且高效地训练SDEs。本研究在基于结构的药物设计任务上评估了算法,并优化了生成的配体分子的结合亲和力。本研究提出的方法在CrossDocked2020数据集上实现了最佳Vina得分。 论文链接:https://arxiv.org/abs/2403.04154

**12. **多智能体系统中的序列异步动作协调:斯塔克尔伯格决策Transformer方法

Sequential Asynchronous Action Coordination in Multi-Agent Systems: A Stackelberg Decision Transformer Approach

论文作者:张斌,毛航宇,李丽娟,徐志伟,李大鹏,赵瑞,范国梁 在多智能体系统中,智能体不仅需要最大化自身奖励,还需与其他智能体动态协调,以实现最佳联合策略。现有的MARL方法大多假设智能体之间的同步动作,限制了其在复杂场景中的应用。 这篇文章探讨了多智能体系统中的异步动作协调问题。作者提出了一种新的方法—Stackelberg Decision Transformer(STEER),旨在通过结合斯塔克尔伯格博弈的层次决策结构和自回归序列模型的建模能力,来提高多智能体强化学习方法的可扩展性。STEER引入了双Transformer架构,其中内部Transformer块能够实现博弈抽象,有效处理不同环境下的状态配置,外部Transformer块则促进了每个智能体策略函数和价值函数的自回归拟合。这种架构还能够并行更新所有智能体的策略,大幅降低了之前基于斯塔克尔伯格博弈博弈的强化学习方法的计算成本。此外,文章还提出了知识蒸馏方案来实现其在分散式执行系统中的部署。

**13. **SpikeLM:通过松弛双向脉冲机制实现脉冲驱动的通用语言建模

SpikeLM: Towards General Spike-Driven Language Modeling via Elastic Bi-Spiking Mechanisms

论文作者:邢兴润,张正,倪子懿,肖诗涛,鞠一鸣,樊思琪,王业全,张家俊,李国齐 文章的目标是开发一种类脑的低功耗人工智能语言模型,即生物启发的脉冲神经网络(SNNs)。与传统的人工神经网络(ANNs)相比,SNNs具有生物神经细胞可解释性、事件驱动的稀疏性和二值激活的优势。近期,大规模语言模型展现出了让人印象深刻的泛化能力,这激发了探索更通用的脉冲驱动模型的动机。然而,现有SNN中的二值脉冲无法编码足够的语义信息,这给泛化带来了技术挑战。 本文提出了一种全新的全脉冲机制,用于通用语言任务,包括判别性和生成性任务。与以往的{0,1}脉冲不同,我们提出了一种更通用的脉冲形式,具有双向、松弛的幅度和频率编码,同时保持了SNN的加性特性。在单时间步中,脉冲通过方向和幅度信息得到增强;在脉冲频率上,我们设计了一种控制脉冲发射率的策略。我们将这种松弛的双向脉冲机制应用于语言建模,命名为SpikeLM。这是第一次使用全脉冲驱动模型处理通用语言任务,其准确性大幅超越了以往方法。SpikeLM还大大缩小了SNN和ANN在语言建模中的性能差距。

代码链接:https://github.com/XingrunXing/SpikeLM

成为VIP会员查看完整内容
1

随着单域无人系统复杂环境感知、精准推理决策、协同运动控制等智能化技术的发展,海洋自主无人系统趋向 跨域协同方向发展。分析了国外跨域协同概念及其发展动因,梳理了国外空中域、水面域、水下域三类域节点的海上无人装 备典型协同运用实践,从中提取了协同控制架构、协同导航定位、协同态势感知和协同任务规划等关键技术,相关成果可为 国内海洋自主无人系统跨域协同技术发展提供参考和支撑。 目前,以美国为代表的国外海洋装备强国大力 发展空中无人机、水面无人艇、水下无人航行器等 多域多类型无人装备,并持续推动无人装备执行任 务由单域单体向单域集群,再向跨域集群的协同增 效方向转变。 近年来,国外开展了多型无人装备湖上和海上 跨域协同实践研究工作,不断加快相关装备技术和 海上应用研究[1~4] 。通过分析国外海洋自主无人系 统跨域协同研究实践,利于明晰跨域协同应用场 景、界定跨域协同使命定位,剖析关键技术破解思 路,研判未来技术发展趋势,为国内海洋自主无人 系统跨域协同研究提供有益参考和借鉴。

成为VIP会员查看完整内容
3

转载机器之心: 具身智能是实现通用人工智能的必经之路,其核心是通过智能体与数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多智能体与具身智能研究所联合中山大学 HCP 实验室的研究人员,对具身智能的最新进展进行了全面解析,推出了多模态大模型时代的全球首篇具身智能综述。

该综述调研了近 400 篇文献,从多个维度对具身智能的研究进行了全面解析。该综述首先介绍了一些具有代表性的具身机器人和具身仿真平台,深入分析了其研究重点和局限性。接着,透彻解析了四个主要研究内容:1) 具身感知,2) 具身交互,3) 具身智能体和 4) 虚拟到现实的迁移,这些研究内容涵盖了最先进的方法、基本范式和全面的数据集。此外,该综述还探讨了数字空间和物理世界中具身智能体面临的挑战,强调其在动态数字和物理环境中主动交互的重要性。最后,该综述总结了具身智能的挑战和局限,并讨论了其未来的潜在方向。本综述希望能够为具身智能研究提供基础性参考,并推动相关技术创新。此外,该综述还在 Github 发布了具身智能 paper list,相关的论文和代码仓库将持续更新,欢迎关注。

**1. 具身智能的前世今生

具身智能的概念最初由艾伦・图灵在 1950 年建立的具身图灵测试中提出,旨在确定智能体是否能显示出不仅限于解决虚拟环境(数字空间)中抽象问题的智能(智能体是具身智能的基础,存在于数字空间和物理世界中,并以各种实体的形式具象化,这些实体不仅包括机器人,还包括其他设备。),还能应对物理世界的复杂性和不可预测性。因此,具身智能的发展被视为一条实现通用人工智能的基本途径。深入探讨具身智能的复杂性、评估其当前的发展现状并思考其未来的发展轨迹显得尤为重要。如今,具身智能涵盖了计算机视觉、自然语言处理和机器人技术等多个关键技术,其中最具代表性的是具身感知、具身交互、具身智能体和虚拟到现实的迁移。在具身任务中,具身智能体必须充分理解语言指令中的人类意图,积极主动探索周围环境,全面感知来自虚拟和物理环境的多模态元素,并执行适当的操作以完成复杂任务。多模态模型的快速进展展示了在复杂环境中相较于传统深度强化学习方法更强的多样性、灵活性和泛化能力。最先进的视觉编码器预训练的视觉表示提供了对物体类别、姿态和几何形状的精确估计,使具身模型能够全面感知复杂和动态的环境。强大的大语言模型使机器人更好地理解人类的语言指令并为具身机器人对齐视觉和语言表示提供了可行的方法。世界模型展示了显著的模拟能力和对物理定律的良好理解,使具身模型能够全面理解物理和真实环境。这些进展使具身智能体能够全面感知复杂环境,自然地与人类互动,并可靠地执行任务。下图展示了具身智能体的典型架构。

具身智能体框架 在本综述中,我们对具身智能的当前进展进行了全面概述,包括:(1)具身机器人 —— 具身智能在物理世界中的硬件方案;(2)具身仿真平台 —— 高效且安全地训练具身智能体的数字空间;(3)具身感知 —— 主动感知 3D 空间并综合多种感官模态;(4)**具身交互 **—— 有效合理地与环境进行交互甚至改变环境以完成指定任务;(5)具身智能体 —— 利用多模态大模型理解抽象指令并将其拆分为一系列子任务再逐步完成;(6)虚拟到现实的迁移 —— 将数字空间中学习到的技能迁移泛化到物理世界中。下图展示了具身智能从数字空间到物理世界所涵盖的体系框架。本综述旨在提供具身智能的全面背景知识、研究趋势和技术见解。

本综述整体架构 2. 具身机器人

具身智能体积极与物理环境互动,涵盖了广泛的具身形态,包括机器人、智能家电、智能眼镜和自动驾驶车辆等。其中,机器人作为最突出的具身形态之一,备受关注。根据不同的应用场景,机器人被设计成各种形式,以充分利用其硬件特性来完成特定任务。如下图所示,具身机器人一般可分为:(1)固定基座型机器人,如机械臂,常应用在实验室自动化合成、教育、工业等领域中;(2)轮式机器人,因高效的机动性而闻名,广泛应用于物流、仓储和安全检查;(3)履带机器人,具有强大的越野能力和机动性,在农业、建筑和灾难场景的应对方面显示出潜力;(4)四足机器人,以其稳定性和适应性而闻名,非常适合复杂地形的探测、救援任务和军事应用。(5)人形机器人,以其灵巧手为关键,在服务业、医疗保健和协作环境等领域广泛应用。(6)仿生机器人,通过模拟自然生物的有效运动和功能,在复杂和动态的环境中执行任务。

不同形态的具身机器人 3. 具身智能仿真平台

具身智能仿真平台对于具身智能至关重要,因为它们提供了成本效益高的实验手段,能够通过模拟潜在的危险场景来确保安全,具有在多样环境中进行测试的可扩展性,具备快速原型设计能力,能够为更广泛的研究群体提供便利,提供用于精确研究的可控环境,生成用于训练和评估的数据,并提供算法比较的标准化基准。为了使智能体能够与环境互动,必须构建一个逼真的模拟环境。这需要考虑环境的物理特性、对象的属性及其相互作用。如下图所示,本综述将对两种仿真平台进行分析:基于底层仿真的通用平台和基于真实场景的仿真平台。

通用仿真平台

基于真实场景的仿真平台 4. 具身感知

未来视觉感知的 “北极星” 是以具身为中心的视觉推理和社会智能。如下图所示,不同于仅仅识别图像中的物体,具有具身感知能力的智能体必须在物理世界中移动并与环境互动,这需要对三维空间和动态环境有更透彻的理解。具身感知需要具备视觉感知和推理能力,理解场景中的三维关系,并基于视觉信息预测和执行复杂任务。该综述从主动视觉感知、3D 视觉定位、视觉语言导航、非视觉感知(触觉传感器)等方面进行介绍。

主动视觉感知框架 5. 具身交互

具身交互指的是智能体在物理或模拟空间中与人类和环境互动的场景。典型的具身交互任务包括具身问答和具身抓取。如下图所示,在具身问答任务中,智能体需要从第一人称视角探索环境,以收集回答问题所需的信息。具有自主探索和决策能力的智能体不仅要考虑采取哪些行动来探索环境,还需决定何时停止探索以回答问题,如下图所示。

具身问答框架 除了与人类进行问答交互外,具身交互还涉及基于人类指令执行操作,例如抓取和放置物体,从而完成智能体、人类和物体之间的交互。如图所示,具身抓取需要全面的语义理解、场景感知、决策和稳健的控制规划。具身抓取方法将传统的机器人运动学抓取与大型模型(如大语言模型和视觉语言基础模型)相结合,使智能体能够在多感官感知下执行抓取任务,包括视觉主动感知、语言理解和推理。

语言引导的交互式抓取框架 6. 具身智能体

智能体被定义为能够感知环境并采取行动以实现特定目标的自主实体。多模态大模型的最新进展进一步扩大了智能体在实际场景中的应用。当这些基于多模态大模型的智能体被具身化为物理实体时,它们能够有效地将其能力从虚拟空间转移到物理世界,从而成为具身智能体。为了使具身智能体在信息丰富且复杂的现实世界中运行,它们已经被开发出强大的多模态感知、交互和规划能力。如下图所示,为了完成任务,具身智能体通常涉及以下过程: (1)将抽象而复杂的任务分解为具体的子任务,即高层次的具身任务规划。(2)通过有效利用具身感知和具身交互模型,或利用基础模型的策略功能,逐步实施这些子任务,这被称为低层次的具身行动规划。 值得注意的是,任务规划涉及在行动前进行思考,因此通常在数字空间中考虑。相比之下,行动规划必须考虑与环境的有效互动,并将这些信息反馈给任务规划器以调整任务规划。因此,对于具身智能体来说,将其能力从数字空间对齐并推广到物理世界至关重要。

基于多模态大模型的具身智能体框架 7. 虚拟到现实的迁移

具身智能中的虚拟到现实的迁移(Sim-to-Real adaptation)指的是将模拟环境(数字空间)中学习到的能力或行为转移到现实世界(物理世界)中的过程。该过程包括验证和改进在仿真中开发的算法、模型和控制策略的有效性,以确保它们在物理环境中表现得稳定可靠。为了实现仿真到现实的适应,具身世界模型、数据收集与训练方法以及具身控制算法是三个关键要素,下图展示了五种不同的 Sim-to-Real 范式。

五种虚拟到现实的迁移方案 8. 挑战与未来发展方向

尽管具身智能发展迅速,但它面临着一些挑战,并呈现出令人兴奋的未来方向: (1)高质量机器人数据集。获取足够的真实世界机器人数据仍然是一个重大挑战。收集这些数据既耗时又耗费资源。单纯依靠模拟数据会加剧仿真到现实的差距问题。创建多样化的真实世界机器人数据集需要各个机构之间紧密且广泛的合作。此外,开发更真实和高效的模拟器对于提高模拟数据的质量至关重要。为了构建能够在机器人领域实现跨场景和跨任务应用的通用具身模型,必须构建大规模数据集,利用高质量的模拟环境数据来辅助真实世界的数据。 (2)人类示范数据的有效利用。高效利用人类演示数据包括利用人类展示的动作和行为来训练和改进机器人系统。这个过程包括收集、处理和从大规模、高质量的数据集中学习,其中人类执行机器人需要学习的任务。因此,重要的是有效利用大量非结构化、多标签和多模态的人类演示数据结合动作标签数据来训练具身模型,使其能够在相对较短的时间内学习各种任务。通过高效利用人类演示数据,机器人系统可以实现更高水平的性能和适应性,使其更能在动态环境中执行复杂任务。 (3)复杂环境认知。复杂环境认知是指具身智能体在物理或虚拟环境中感知、理解和导航复杂现实世界环境的能力。对于非结构化的开放环境,目前的工作通常依赖预训练的 LLM 的任务分解机制,利用广泛的常识知识进行简单任务规划,但缺乏具体场景理解。增强知识转移和在复杂环境中的泛化能力是至关重要的。一个真正多功能的机器人系统应该能够理解并执行自然语言指令,跨越各种不同和未见过的场景。这需要开发适应性强且可扩展的具身智能体架构。 (4)长程任务执行。执行单个指令通常涉及机器人执行长程任务,例如 “打扫厨房” 这样的命令,包含重新排列物品、扫地、擦桌子等活动。成功完成这些任务需要机器人能够规划并执行一系列低级别动作,且持续较长时间。尽管当前的高级任务规划器已显示出初步的成功,但由于缺乏对具身任务的调整,它们在多样化场景中往往显得不足。解决这一挑战需要开发具备强大感知能力和大量常识知识的高效规划器。 (5)因果关系发现。现有的数据驱动的具身智能体基于数据内部的相关性做出决策。然而,这种建模方法无法使模型真正理解知识、行为和环境之间的因果关系,导致策略存在偏差。这使得它们难以在现实世界环境中以可解释、稳健和可靠的方式运行。因此,具身智能体需要以世界知识为驱动,具备自主的因果推理能力。 (6)持续学习。在机器人应用中,持续学习对于在多样化环境中部署机器人学习策略至关重要,但这一领域仍未被充分探索。虽然一些最新研究已经探讨了持续学习的子主题,如增量学习、快速运动适应和人机互动学习,但这些解决方案通常针对单一任务或平台设计,尚未考虑基础模型。开放的研究问题和可行的方法包括:1) 在最新数据上进行微调时混合不同比例的先前数据分布,以缓解灾难性遗忘,2) 从先前分布或课程中开发有效的原型,用于新任务的推理学习,3) 提高在线学习算法的训练稳定性和样本效率,4) 确定将大容量模型无缝集成到控制框架中的原则性方法,可能通过分层学习或慢 - 快控制,实现实时推理。 (7)统一评估基准。尽管有许多基准用于评估低级控制策略,但它们在评估技能方面常常存在显著差异。此外,这些基准中包含的物体和场景通常受到模拟器限制。为了全面评估具身模型,需要使用逼真的模拟器涵盖多种技能的基准。在高级任务规划方面,许多基准通过问答任务评估规划能力。然而,更理想的方法是综合评估高级任务规划器和低级控制策略的执行能力,特别是在执行长时间任务和衡量成功率方面,而不仅仅依赖于对规划器的单独评估。这种综合方法能够更全面地评估具身智能系统的能力。 总之,具身智能使智能体能够感知、认知并与数字空间和物理世界中的各种物体互动,显示了其在实现通用人工智能方面的重要意义。本综述全面回顾了具身机器人、具身仿真平台、具身感知、具身交互、具身智能体、虚拟到现实的机器人控制以及未来的研究方向,这对沿着促进具身智能的发展具有重要意义。 关于鹏城实验室多智能体与具身智能研究所

隶属鹏城实验室的多智能体与具身智能研究所汇聚了数十名智能科学与机器人领域顶尖青年科学家,依托鹏城云脑、中国算力网等自主可控 AI 基础设施,致力于打造多智能体协同与仿真训练平台、云端协同具身多模态大模型等通用基础平台,赋能工业互联网、社会治理与服务等重大应用需求。

成为VIP会员查看完整内容
3

分布变迁仍然是成功和可靠部署机器学习(ML)系统的重大障碍。解决这些脆弱性的长期方案只能通过理解基准测试根本无法捕捉所有可能发生的变化而实现;同样重要的是,通过仔细实验AI系统,理解它们在实际分布变迁下的失败。本论文描述了我在构建可信赖和可靠的机器学习基础方面的工作。调查的工作大致分为三个主要类别:(i)设计正式的、实用的真实世界分布变迁结构表征;(ii)利用这种结构开发证明正确且高效的学习算法,能够稳健处理这种变迁;以及(iii)实验现代ML系统,理解现实世界重尾和分布变迁的实际影响,包括平均情况和最坏情况。

第一部分描述了可扩展地认证深度神经网络对对抗攻击的稳健性的工作。所提出的方法可用于认证对测试样本、训练数据或更一般地对任何影响模型最终预测的输入的攻击的稳健性。在第二部分中,我们关注变迁的潜变量模型,借鉴因果关系和其他结构化编码的概念。我们展示了这些模型如何通过环境/干预复杂性这一新视角,进行使用多种分布进行稳健深度学习的方法的正式分析。环境/干预复杂性是领域泛化和因果表示学习的核心统计测量,通过训练分布数量和多样性来量化误差和/或结构化可识别性条件。最后,在第三部分中,我们广泛探索了更好地理解和利用自然数据中的变化的方法,并展示了所得见解如何促进设计在现实世界中更加稳健和可靠的新方法。

预测算法通过其在未见测试数据上的表现来评估和重视。在经典的机器学习(ML)中,通常假设这些数据是相互独立地从与训练算法所用数据集相同的分布中抽取的(这被称为IID假设)。然而,在现实世界中,这种情况几乎从未满足。IID假设作为一种有价值的抽象,用于研究如何高效且可靠地从数据中学习。然而,统计学家早已明白这一假设是一种过度简化,现实世界的数据底层分布不断发生变迁:例如,时间上的变迁、异质子群体间的变迁、因过去行为而引发的变迁等。由于现实与理想化的IID数据假设之间的这种差异,在分布内提供强泛化保证的算法(如经验风险最小化[Vapnik, 1999])在现实世界中会出乎意料地失败,通常伴随着高置信度且无事先警告。特别是,尽管现代深度神经网络在许多任务上实现了超人表现,但越来越多的证据表明,其令人难以置信的泛化能力主要限于测试数据与训练数据非常相似的情况下。这些模型似乎依赖于数据的统计信息表示——出于尚未完全理解的原因——远远超越了对训练数据的简单记忆,但这些表示通常不能使其泛化到新领域或新任务。即使是对于看似微不足道的人类变化,这种情况也依然存在(Beery et al., 2018; Geirhos et al., 2018)。因此,现代最先进的生成和判别深度网络在部署中是脆弱的,并且在出人意料的轻微分布变迁下容易出错(Su et al., 2019; Recht et al., 2019)。

在考虑如何解决这一弱点时,人们可能会想象使得上述深度学习取得实际成功的方法最终也能解决这个问题。过去十年ML研究惊人速度的主要推动力是“基准测试方法”:通过对代表性基准数据集的一系列任务进行一致的、逐步的改进来推进。尽管这一策略的成功是不可否认的,但显然它不足以实现真正稳健和可靠的ML未来。人工智能(AI)正在迅速部署到无数新的领域——并且只会变得更加普遍——但它尚不能被广泛依赖,而意外失败的潜在成本仍在增加。同时,在现实世界中引发这种失败的变迁例子比比皆是:例如,自动驾驶汽车遇到的简单景观和/或天气变化,或者用户调整其行为以增加他们首选结果的可能性(Hardt et al., 2016)。更糟糕的是,AI越来越多地被用于安全关键环境,这在面对有意的对手时呈现出严重的安全漏洞(Sharif et al., 2016)。这种脆弱性仍然是进一步可信赖部署ML系统的重大障碍。

解决这些脆弱性的长期方案只能通过理解基准测试根本无法捕捉所有可能发生的变化而实现。但是,显然对所有分布变迁的稳健性是不可行的。相反,我们必须首先设计精确、现实的真实世界分布变迁的数学定义:通过正式指定我们希望稳健应对的变迁的“威胁模型”,我们将能够朝着正式的稳健性保证可靠地前进。同时,ML理论和实践(特别是在深度学习中)之间经常存在不匹配,因此单单数学定义变迁是不够的。我们还需要仔细实验AI系统,以理解它们在实际中的失败模式——只有通过这样的实验,我们才能理解和调和现实世界数据与我们的数学理解之间的差异。反过来,这将推动新型、更可靠且可解释的ML方法的发展,对性能产生实际的下游益处。

本论文描述了通过结合这两种核心方法,为可信赖和可靠的机器学习奠定基础的进展。更具体地说,所调查的工作大致分为三大类:(i)设计正式的、实用的真实世界分布变迁结构表征,包括良性和对抗性的;(ii)利用这种结构开发证明正确且高效的学习算法,能够稳健处理这些变迁;以及(iii)实验现代ML系统,以理解分布变迁的实际影响,包括平均情况和最坏情况,以便未来的分析能够更好地捕捉我们期望AI在未来遇到的困难类型。

论文概述

**第一部分

本论文的第一部分描述了大规模认证深度神经网络对抗攻击稳健性的工作。第2章展示了如何将任何在高斯噪声下分类良好的分类器转变为对ℓ2范数下的对抗扰动具有认证稳健性的新分类器。我们证明了使用高斯噪声平滑在ℓ2范数下的紧密稳健性保证,获得了一个在ImageNet上在ℓ2范数小于0.5 (=127/255) 的对抗扰动下具有49%认证top-1准确率的分类器。在第3章中,我们展示了如何使用所提出的方法来认证对更一般的攻击的稳健性,例如对训练数据的对抗性修改,或更一般地说,任何影响模型最终预测的输入。

**第二部分

第二部分侧重于变迁的潜变量模型,灵感来自因果关系和其他提出的真实世界变化的结构化编码。我们展示了这些模型的重要性及其如何使使用多种分布进行稳健深度学习的方法的形式化分析成为可能。特别是,我们通过环境/干预复杂性这一新视角研究这些算法的行为——这是领域泛化和因果表示学习的核心统计测量,通过观察的环境数量来量化误差和/或潜在特征的可识别性。第4章在一个相当自然和一般的模型下,首次分析了为这些任务提出的各种目标下的分类。我们还在非线性领域中展示了这些方法的首个结果:除非测试数据与训练分布足够相似,否则这些方法可能会灾难性地失败。随后在第5章中,我们提供了改进的分析以及更强的下界。第6章考虑了在线领域泛化的设置,首次正式量化了领域“插值”和“外推”之间的计算复杂性差距。

**第三部分

论文的最后一部分广泛探索了更好地理解和利用自然数据中的变化的方法。首先,在第7章中,我们展示了预训练特征足以生成比以前认为的更稳健的预测器。第8章描述了这一发现如何使得使用未标记的测试数据以证明神经网络适时适应变迁,或给出(几乎)有证明的非空的测试误差界成为可能。接下来,第9章开发了一种稳健优化方法用于策略分类,使得双重稳健预测能够优雅地处理策略响应和用户成本函数中的不可避免的不确定性。最后,第10章展示了离群值对神经网络优化的显著影响——这一结果为理解自然数据的重尾如何影响网络行为提供了新的见解,并提出了神经网络优化中各种现象起源的更一致的图景。

成为VIP会员查看完整内容
1

理解大规模语言模型(LLMs)中的知识机制对于迈向可信的通用人工智能(AGI)至关重要。本文从一个新的分类法角度回顾了知识机制的分析,包括知识利用和进化。知识利用探讨了记忆、理解与应用及创造的机制。知识进化则关注个体和群体LLMs中知识的动态发展。此外,我们讨论了LLMs所学到的知识、参数化知识脆弱的原因以及潜在的黑暗知识(假设)所带来的挑战。我们希望这项工作能帮助理解LLMs中的知识,并为未来的研究提供见解。

知识是智慧的基石和文明延续的基础,为我们提供了导航复杂问题和应对新兴挑战的基本原则和指导(Davis et al., 1993; Choi, 2022)。在漫长的进化历史中,我们致力于利用已获得的知识和探索未知知识的前沿,以培养更高级的智慧(McGraw and Harbison-Briggs, 1990; Han et al., 2021)。 众所周知,大规模语言模型(LLMs)也因其涵盖了广泛的参数化知识而闻名(Roberts et al., 2020; Sung et al., 2021; Cao et al., 2021; Zhong et al., 2021; Kandpal et al., 2023; Heinzerling and Inui, 2020; Petroni et al., 2019; Qiao et al., 2023; Kritharoula et al., 2023; He et al., 2024a),在应用上取得了前所未有的进展。然而,LLMs在学习、存储、利用和进化方面的知识机制仍然是一个谜(Gould et al., 2023a)。大量研究试图通过知识神经元(Dai et al., 2022; Chen et al., 2024a)和电路(Elhage et al., 2021; Yao et al., 2024; Zou et al., 2024)来揭示LLMs中各种类型的知识,但这些努力分散在各个任务中,尚待全面的回顾和分析。 如图1所示,本文开创性地回顾了整个知识生命周期中的机制。我们还提出了一种新的LLMs知识机制分类法,如图2所示,涵盖了特定时间的知识利用和整个LLMs期间的知识进化。具体来说,我们首先介绍了该领域的基本知识(§2)并从新的角度回顾了知识利用机制(§3)。然后,我们深入探讨了知识进化的基本原则(§4),讨论了知识利用的挑战,并提出了一些有前景的假设来探索开发强大且可信模型的潜在途径(§5)。最后,我们还提供了一些未来方向(§6)和知识机制分析工具(§C)。我们的贡献如下: * 据我们所知,我们是首个回顾LLMs中知识机制并提供整个生命周期内的新分类法的。 * 我们提出了一种新的视角,从记忆、理解与应用及创造三个层次分析知识利用机制。 * 我们讨论了个体和群体LLMs中的知识进化,并分析了这一过程中固有的冲突和整合。 * 我们怀疑普遍的Transformer架构可能阻碍创造力,数据分布和数量可能导致参数化知识的脆弱性,引发幻觉和知识冲突。此外,黑暗知识将长期存在。

与现有综述的比较以往的可解释性综述通常旨在从全局和局部分类法角度研究解释LLMs中不同组件作用的各种方法(Ferrando et al., 2024; Zhao et al., 2024a; Luo and Specia, 2024; Murdoch et al., 2019; Bereska and Gavves, 2024; Vilas et al., 2024; Singh et al., 2024)。相比之下,本文侧重于LLMs中的知识。因此,我们的分类法以LLMs中的目标知识为导向,回顾了知识的获取、存储、利用及后续进化。此外,以前的分类法大多探讨推理阶段(一个特定时期)的可解释性,而忽略了预训练阶段的知识获取和后训练阶段的进化(Räuker et al., 2023; Luo et al., 2024b; Apidianaki, 2023; Jiao et al., 2023; Räuker et al., 2023; Rai et al., 2024)。我们的分类法旨在探索从幼稚到成熟的各个阶段的动态进化,无论是个体还是群体LLMs。 与最相似的综述(Cao et al., 2024a)引入的知识生命周期相比,我们的工作重点是每个阶段的底层机制。总体而言,本文可能有助于我们探索和操作LLMs中的高级知识,通过知识进化的历史检查当前的局限性,并为未来模型的更高效和可信的架构和学习策略提供灵感。请注意,本文中的大多数假设源自基于Transformer的LLMs。我们还验证了这些假设在其他架构模型中的普适性,然后在§B中提出普遍智能。

成为VIP会员查看完整内容
2
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员