大模型
【新书】LangChain: 大模型AI应用开发实用指南
专知会员服务
14+阅读 · 今天4:51
大模型时代的自动图表理解综述
专知会员服务
9+阅读 · 今天4:41
大模型个性化情感机器人报告,41页ppt
专知会员服务
37+阅读 · 3月17日

本文着手探讨了大型语言模型(LLM)数据集,这些数据集在LLM的显著进步中扮演了关键角色。这些数据集作为类似根系的基础设施,支持并促进了LLM的发展。因此,对这些数据集的审查成为研究中的一个关键话题。为了解决当前对LLM数据集的全面概述和彻底分析的缺乏,以及获得对它们当前状态和未来趋势的洞见,这篇综述整合并分类了LLM数据集的基本方面,从五个视角出发:(1)预训练语料库;(2)指令微调数据集;(3)偏好数据集;(4)评估数据集;(5)传统自然语言处理(NLP)数据集。该综述揭示了当前面临的挑战,并指出了未来调查的潜在途径。此外,还提供了现有可用数据集资源的全面回顾,包括来自444个数据集的统计数据,涵盖8种语言类别和32个领域。数据集统计信息中纳入了来自20个维度的信息。调查的总数据大小超过了774.5TB的预训练语料库和700M实例的其他数据集。我们旨在呈现LLM文本数据集的整个景观,作为该领域研究者的全面参考,并为未来的研究做出贡献。相关资源可在以下地址找到:https://github.com/lmmlzn/Awesome-LLMs-Datasets。

随着ChatGPT(OpenAI,2022年)的发布,仅仅几个月时间,大型语言模型(LLMs)便吸引了越来越多的研究关注,成为了一个热门的研究领域。各种LLMs相继被开源,参数规模从几十亿到超过一千亿不等。示例包括LLaMA(Touvron等人,2023a,b),Phi(Gunasekar等人,2023;Li等人,2023k;Javaheripi等人,2023),ChatGLM(Du等人,2022;Zeng等人,2023a),QWen(Bai等人,2023a),Baichuan(Yang等人,2023a)等。大量工作涉及对基础模型的微调,产生了表现良好的通用对话模型或领域特定模型。广泛采用的人类反馈强化学习(RLHF)和LLMs评估的精细化进一步优化了LLMs的性能。LLMs所展示的巨大潜力,部分可以归功于用于训练和测试的数据集。俗话说,“巧妇难为无米之炊。”如果没有高质量数据集作为基础,想要培养出枝繁叶茂的LLMs之树是极其困难的。因此,LLMs数据集的构建和分析是一个值得关注的领域。 文本数据集的发展经历了几个阶段,从早期的自然语言处理(NLP)任务数据集到当前的LLMs数据集。在1960年代到1980年代,NLP的早期阶段主要关注语义分析和机器翻译等基础任务。数据集规模相对较小,通常是手工注释的。后来,从1987年开始的消息理解会议(MUC)(Grishman和Sundheim,1996)专注于信息提取和关系提取(RE)等任务的数据集。2000年后,NLP领域继续强调对传统任务和语言结构的研究,同时也转向关注对话系统(Paek,2006;Yan等人,2017;Devlin等人,2019;Zhang等人,2020b)等新兴领域。随着深度学习的兴起,NLP数据集向更大规模、更高复杂性、更多样性和更大挑战性发展。同时,出现了全面的性能评估(Srivastava等人,2023;Liang等人,2023;Li等人,2023n)、对话数据集(Zeng等人,2020;Yang等人,2023b;Ding等人,2023)、零样本和少样本数据集(Hendrycks等人,2021b;Xu等人,2021;Longpre等人,2023a)、多语言数据集(Conneau等人,2018;Siddhant等人,2020;Costa-jussà等人,2022)等。到2022年底,LLMs将数据集推向了一个新的高峰,实现了从“以任务为中心的构建”到“围绕任务和阶段的构建中心”的数据集发展转变。LLMs数据集不仅基于任务进行分类,还与LLMs的不同阶段有关。从最初的预训练阶段到最终的评估阶段,我们将LLMs数据集分为四类:预训练语料库、指令微调数据集、偏好数据集和评估数据集。这些数据集的组成和质量深刻影响了LLMs的性能。

当前LLM数据集的爆炸式增长为研究带来了挑战。一方面,这经常导致当尝试理解和学习这些数据集时,难以知道从何开始。另一方面,各种数据集之间在类型、领域取向、现实世界场景等方面缺乏系统的组织。为了降低学习曲线,促进数据集研究和技术创新,扩大公众意识,我们进行了LLM数据集的调研。目的是为研究人员提供一个全面且富有洞察力的视角,便于更好地理解LLM数据集的分布和作用,从而推进LLM的集体知识和应用。

本文总结了现有代表性数据集,跨越五个维度:预训练语料库、指令微调数据集、偏好数据集、评估数据集和传统NLP数据集。此外,它提出了新的见解和想法,讨论了当前的瓶颈,并探索了未来发展趋势。我们还提供了公开可用的数据集相关资源的全面回顾。它包括来自444个数据集的统计数据,跨越8种语言类别,涵盖32个不同领域,覆盖了来自20个维度的信息。调查的总数据量超过了774.5TB的预训练语料库和700M以上实例的其他数据集。由于空间限制,本调查仅讨论纯文本LLM数据集,并不涵盖多模态数据集。

据我们所知,这是第一个专注于LLM数据集的调查,呈现了整个景观。LLM数据集的时间线如图2所示。在此之前,几项与LLM相关的调查,如赵等人(2023年)和米纳伊等人(2024年),分析了LLM的最新发展,但缺乏对数据集的详细描述和总结。张等人(2023g)总结了LLM的指令微调阶段。常等人(2023年)和郭等人(2023c)总结了评估阶段。然而,这些调查仅关注LLM数据集的一部分,并且数据集相关信息不是中心焦点。与上述调查相比,我们的论文强调LLM数据集,旨在在这一特定领域提供更详细和全面的调查。

总体组织结构如图1所示。本文的其余部分组织如下。第2节总结了按数据类型和领域特定的预训练语料库分类的一般预训练语料库。它还概述了预训练数据的预处理步骤和方法。第3节总结了按构建方法和领域特定的指令微调数据集分类的一般指令微调数据集。提供了15个指令类别。第4节总结了按偏好评估方法分类的偏好数据集。第5节总结了按评估领域分类的评估数据集,并综合了不同的评估方法。第6节总结了按任务分类的传统NLP数据集。第7节简要识别了数据集内遇到的挑战,并预测了未来研究方向。第8节总结了本文。数据集的详细描述可以在附录A至E中找到。

预训练语料库

预训练语料库是在LLMs预训练过程中使用的大型文本数据集合。在所有类型的数据集中,预训练语料库的规模通常是最大的。在预训练阶段,LLMs从大量未标记的文本数据中学习广泛的知识,然后将其存储在模型参数中。这使LLMs具备一定水平的语言理解和生成能力。预训练语料库可以包含各种类型的文本数据,如网页、学术材料、书籍,同时也涵盖来自不同领域的相关文本,如法律文件、年度财务报告、医学教材和其他领域特定数据。

根据预训练语料库涉及的领域,它们可以分为两种类型。第一种是通用预训练语料库,包括来自不同领域和主题的大规模文本数据混合体。数据通常包括来自互联网的文本内容,如新闻、社交媒体、百科全书等。目的是为NLP任务提供通用的语言知识和数据资源。第二种是领域特定的预训练语料库,它们专门包含特定领域或主题的相关数据。其目的是为LLMs提供专业知识。

作为LLMs的基石,预训练语料库影响预训练的方向和模型未来的潜力。它们扮演着几个关键角色,如下所示: * 提供通用性。大量的文本数据帮助模型更好地学习语言的语法、语义和上下文信息,使它们能够获得对自然语言的通用理解。 * 增强泛化能力。来自不同领域和主题的数据让模型在训练过程中获得更广泛的知识,从而增强它们的泛化能力。 * 提升性能水平。来自领域特定预训练语料库的知识注入使模型在下游任务上达到更优的性能。 * 支持多语言处理。预训练语料库中包含多种语言,使模型能够理解不同语言环境中的表达,促进跨语言任务的能力发展。

指令微调数据集

指令微调数据集由一系列文本对组成,包括“指令输入”和“答案输出”。 “指令输入”代表人类对模型的请求,包括分类、摘要、改写等多种类型。“答案输出”是模型根据指令生成的响应,与人类的期望相一致。 构建指令微调数据集有四种方式:(1)手动创建,(2)模型生成,例如使用自指导方法(Self-Instruct)(王等,2023f),(3)收集和改进现有的开源数据集,以及(4)上述三种方法的组合。 指令微调数据集用于进一步微调预训练的LLMs,使模型能够更好地理解并遵循人类的指令。这一过程有助于弥合LLMs的下一词预测目标与让LLMs遵循人类指令的目标之间的差距,从而提升LLMs的能力和可控性(张等,2023g)。

指令微调数据集可以分为两大类:通用指令微调数据集和领域特定指令微调数据集。通用指令微调数据集包含跨多个领域的各种类型的指令,旨在提升模型在广泛任务范围内的性能。通过微调,LLMs能够更好地遵循通用指令。在领域特定指令微调数据集中,指令专门为特定领域设计。例如,医疗指令使模型能够学习并执行医疗诊断和健康护理辅助等任务。

偏好数据集

偏好数据集是一系列提供对相同指令输入的多个响应的偏好评估的指令集合。它们通常由具有不同响应的指令对组成,以及来自人类或其他模型的反馈。这种设置反映了在给定任务或上下文中,人类或模型对不同响应的相对偏好。偏好数据集中的反馈信息通常通过投票、排序、评分或其他形式的比较表现出来。图15根据用于偏好评估的方法对各种偏好数据集进行了分类。收集和组织的偏好数据集信息呈现在表9和表10中。 偏好数据集主要在大模型的对齐阶段使用,旨在帮助模型的输出更紧密地与人类的偏好和期望对齐。与人类偏好的对齐主要体现在三个方面:实用性,具有遵循指令的能力;诚实性,避免捏造;安全性,避免生成非法或有害信息(赵等人,2023)。人类反馈强化学习(RLHF)(Christiano等人,2017;Ziegler等人,2019)和AI反馈强化学习(RLAIF)(李等人,2023c)均采用强化学习方法,使用反馈信号优化模型。除了使用指令数据集进行微调外,还可以使用偏好数据集训练奖励模型。随后,可以应用近端策略优化(PPO)算法,基于奖励模型的反馈进一步微调(Schulman等人,2017)。

结论

在广阔的人工智能领域中,大型语言模型(LLMs)作为迅速成长的突出特征,犹如茂密森林中的高大树木。供养它们成长和发展的数据集可比作这些树木的重要根系,为它们的表现提供必需的养分。遗憾的是,当前与LLM相关的数据集景观广阔,缺乏跨各种类型数据集的统一综合。理解LLM数据集的当前状态和未来趋势呈现出巨大挑战。因此,本综述提供了LLMs数据集的全面分析,将与LLMs相关的数据集按照五个维度进行分类和总结:预训练语料库、指令微调数据集、偏好数据集、评估数据集和传统NLP数据集。在进行这种分类的同时,我们识别了当前的挑战,并概述了未来数据集发展的潜在方向,覆盖了四个关键领域:预训练、指令微调、强化学习和模型评估。我们希望这篇综述能为学术界和工业界的研究人员、新来者和精通LLMs的实践者提供一个宝贵的参考点。我们的最终目标是不断完善LLMs数据集,以培育一个健壯和标准化的数据集生态系统,同时支持LLMs的持续进步。

成为VIP会员查看完整内容
113

来源:清华大学元宇宙文化实验室   近日 ,由清华大学沈阳教授领衔的清华大学元宇宙文化实验室发布了《AIGC发展研究资料2.0》,在1.0版报告基础上进行深化。   《研究资料2.0》用AI研究AI发展,共计211页,从《技术与演进》《影响与信任》《应用与创新》《安全与评估》《政策监管与全球视角》《前沿探索》六大维度展开,聚焦AIGC的多模态发展、多学科影响、全方位应用以及前沿探索,融汇AI产业实践经验、学术研究探讨与社会理念探索,提供AIGC动态综合指南。   具体内容如下:

成为VIP会员查看完整内容
98

大模型测试验证与协同创新中心牵头发布的《2023大模型落地应用案例集》,这是首部聚焦大模型落地应用的权威研究成果。《案例集》自10月启动征集以来,共计收到来自各行业有效案例百余个,地域覆盖北京、上海、广东、浙江、江苏、云南、江苏、重庆、河南、天津等十余个城市,应用领域覆盖智能制造、教育教学、科技金融、广告营销、政务办公、文娱传媒、科学智能、医疗、安全、交通、家居等各个行业,最终评选出52个大模型优秀应用案例。部分内容:

成为VIP会员查看完整内容
88

在过去的几年里,人工智能在语言能力方面取得了惊人的新进展。由深度学习的快速进步所推动,语言AI系统在编写和理解文本方面的能力比以往任何时候都要好。这一趋势促成了新功能、产品乃至整个行业的崛起。通过这本书,Python开发者将学习到使用这些能力所需的实用工具和概念。你将学习如何利用预训练的大型语言模型的力量,用于像文案写作和摘要等用例;创建超越关键词匹配的语义搜索系统;构建分类和聚类文本的系统,以实现对大量文本文档的可扩展理解;以及使用现有库和预训练模型进行文本分类、搜索和聚类。这本书还将向你展示如何:

  • 构建高级LLM管道以聚类文本文档并探索它们所属的主题
  • 使用像密集检索和重排方法构建超越关键词搜索的语义搜索引擎
  • 学习这些模型可以提供价值的各种用例
  • 理解底层变换器模型如BERT和GPT的架构
  • 更深入地理解LLMs是如何被训练的
  • 理解不同的微调方法是如何优化特定应用中的LLMs的(生成模型微调、对比微调、提示学习等)
  • 使用诸如生成模型微调、对比微调和提示学习等方法,为特定应用优化LLMs

成为VIP会员查看完整内容
88

踏上一场引人注目且充满吸引力的旅程,探索工程的未来——《AI提示工程》。这本引人入胜的书邀请您探索人工智能(AI)与工程专业知识的激动人心的融合,解锁创新和无限可能的世界。 深入探究AI对工程流程的变革性影响。这本吸引人的读物揭开了AI驱动的设计、解决问题的能力以及其在各个工程领域的革命性影响的神秘面纱。

无论您是一名初出茅庐的工程师、一个经验丰富的专业人士,还是仅仅对技术前沿充满了好奇,《AI提示工程》都是您了解AI如何重塑景观的入场券。通过真实世界的案例研究,从实际应用中获取洞察力,并将自己定位在这一动态进化的前沿。

本书以易于接近且富有信息量的风格编写,不仅仅是一本指南——它是您在工程领域解锁AI潜力的钥匙。保持领先,利用AI解决方案,成为技术革命时代的开拓者。 沉浸在未来中。立即订购您的《AI提示工程》副本,见证人工智能与工程专业知识的迷人融合。您的创新之旅从这里开始!

成为VIP会员查看完整内容
72

武装冲突中的优势不仅来自于能力或数量上的优势,还来自于资产的使用方式,小到单个车辆和弹药的操作。本文件概述了一项研究计划,重点是针对军事相关场景的小规模战术。小规模交战指的是交战双方的规模--一般是一个对一个、两个对一个和/或一个对两个--以及每个小组的目标或目的都已明确这一事实。问题领域包括追击-规避和目标守卫,其中任何一个都可视为空对空作战、地面资产压制/防御等军事任务中的子问题。在大多数情况下,所考虑的战术包括智能体的控制策略(即其空间机动),但也可能包括角色分配(例如,是充当诱饵还是前锋)以及离散决策(例如,是交战还是撤退)。小规模冲突的战术非常重要,因为它们可以帮助我们了解如何处理更大规模的冲突(多对多、多目标、多决策)。强化学习和神经网络等机器学习方法已被证明能够为大型智能体团队开发控制器。然而,与最优(或均衡)策略相比,这些控制器的性能通常是未知的。微分博弈论以鞍点平衡控制策略和零和博弈中的最小(或最大)成本/回报的形式,为相关情景提供了严格的解决方案。当平衡控制策略可以通过分析获得时,它们就适合机载/实时实施。本文探讨了与经典微分博弈论方法相关的一些挑战。出现这些挑战的主要原因是奇异性的存在,即使是最简单的微分博弈也可能出现奇异性。在** (i) 多追兵、单逃兵微分博弈、(ii) 多智能体炮塔防御场景和 (iii) 交战或撤退场景**中,演示了小规模解决方案的实用性。最终,这项研究成果为新型场景提供了微分博弈和最优控制解决方案、计算奇异曲面的数值技术、计算密集型解决方案的近似值,以及处理具有多个阶段或结果的场景的技术。

图 1.2:蓝队与红队冲突的概念图。红队除了移动智能体外,还有 3 个炮塔。灰色区域可能代表蓝队的目标区域--他们可能希望撤退到那里,或者进入该区域造成破坏或寻找特定目标。当然,在尝试计算各种智能体的控制权之前,可以先考虑它们之间的分配;但即使是这样,也可能取决于每个团队更高层次的任务目标。例如,红队可能希望尽量减少人员伤亡,或尽量减少进入灰色区域的蓝方智能体数量。

对抗性冲突中的战略范围很广,从军事条令到自然生物的行为和适应。在无数的应用领域(如军事、生物、经济、游戏、体育等)中,可以在许多层面上构想战略或战术--从组织层面(即实体群体之间的合作)到个人层面(飞行员、动物、投资者等的决策)。此外,对手不可预测的行动和反应也始终是一个挑战。我们可能会费尽心思去了解冲突的背景或环境、对手的能力,甚至对手当前的状态。然而,最终冲突的结果通常取决于对手现在和将来会做什么。

本研究关注的是小规模冲突层面的战略战术,重点是与军事相关的场景(不过,最终应用的大部分现实情况都将从分析中抽象出来)。"小规模冲突"一词没有精确的数学定义,但在整个分析过程中被用来表示小队智能体之间的冲突,包括一对一(1v1)冲突。大部分分析集中于 1v1、2v1、1v2 和 Mv1 冲突。除了小规模的团队外,小规模冲突还意味着可以将场景归结为每个团队的特定目标。这与规模更大、范围更广的冲突形成鲜明对比,例如,军事任务可能由许多子任务或子目标组成,甚至是由跨越各种资产的许多任务组成的军事战役。

关注的两个主要问题领域是追击-规避和目标防护。在前者中,一个追击者(或一组追击者)试图捕获一个规避者(或一组规避者)。在后者中,防御者试图阻止攻击者到达一组目标状态,这组目标状态可能代表感兴趣的区域或移动智能体的位置。请注意,在本文档的其余部分中,将遵守智能体名称大写的惯例。对于这两个问题领域,主要关注的是智能体的空间机动性。图 1.1 显示了智能体(如飞机)内部各层自主(或自动)控制之间的概念关系。如图所示,本文提出的研究主要涉及最上两层:任务管理器和外循环。例如,本文提出的分析和算法可能会根据 "高层 "决策(如飞机应完成的任务)或以 "高层 "决策为前提,为飞机规定航向参考指令。假定存在一个 "低级"(内环)控制器,该控制器向飞机发送执行器指令,以跟踪外环提供的参考指令。反过来,内环向外环提供飞行器状态信息(如位置)。外循环提供分配任务的性能估计值,任务管理器利用该估计值来评估是否进行更新,例如重新分配任务或重新组建团队。在追击-规避和目标防护方面,任务管理器的可能功能包括为飞行器分配角色或分配任务,例如为追击者分配特定的 "规避者 "作为目标。其他可能的角色包括:充当诱饵,以吸引队友的注意力;充当前锋,瞄准目标;或充当阻挡者,以防止切断对手的某些路径等。此外,任务管理器还可能负责做出不连续的决定,例如攻击者是否应该与防守者交战或完全撤退。

图 1.1:描述自主飞行器等控制层的概念框图。

更大、更复杂的冲突可能涉及更大的智能体团队(即多对多)、许多不同的目标和许多不同的决策。此外,冲突的结构可能会随着时间的推移而改变。图 1.2 展示了这样一个冲突的抽象例子,冲突发生在由 5 个移动智能体组成的蓝队和由 5 个移动智能体与 3 个炮塔组成的红队之间。作为人类,如果我们能理解并推理出每场小规模冲突中的最优方案,我们就更有可能理解更大规模的交战。

微分博弈论(DGT)提供了一种定量分析智能体表现的机制,同时还能让我们深入了解智能体之间的潜在互动。在 DGT 中制定的问题解决方案由每个参与者的鞍点均衡策略以及价值函数组成,后者代表了作为系统状态函数的冲突均衡结果。这些鞍点解决方案非常强大,因为它们向每个玩家保证,如果他们执行均衡策略,无论对手采取什么行动,他们的结果都不会比博弈值差。

拟议的研究计划可概括为:获取新颖小规模对局的微分博弈解,将现有解扩展到更复杂的小规模对局,开发/比较数值技术,以及开发近似解。在整个计划中,重点是微分博弈和最优控制解决方案的实际应用--目标是使单个智能体能够利用机载计算资源,在适合特定任务的时间内计算出其最优/均衡控制输入。因此,我们的目标通常是获得这些问题的闭式解析解。如果无法做到这一点,也可以开发维度更小的参数解,并使用传统的寻根方法快速高效地求解。最后,当解析解和参数解都不可行时,就需要寻找合适的近似解。

在下一节中,将使用 DGT 提出并求解一个经典的追逐-规避场景,其中涉及一个追逐者和一个规避者,以介绍一些关键概念,如参与者、成本函数、控制变量、均衡和价值。第 2 章包含文献调查,为拟议的研究提供必要的背景并确定关键主题。第 3 章将拟议计划具体化为一系列研究目标;最后讨论了所采用方法的挑战和优势。

成为VIP会员查看完整内容
70

来自斯坦福助理教授Tatsunori Hashimoto《大型语言模型》教程,非常值得关注!

成为VIP会员查看完整内容
64

分布式海上作战的概念旨在通过整合有人和无人系统、执行欺骗性战术以及增强单元实施进攻性打击的能力,使部队能够在舰队对舰队的交战中获胜。本报告通过开发一种作战模拟,研究多领域舰队资产的各种组合在海战环境中执行战术行动的能力,为 2030-2035 年 DMO 概念做出贡献。该项目研究友军对敌军使用欺骗和战术的影响,以及由此对对手在杀伤链各阶段进展能力的影响。通过开发和分析离散事件模拟,该研究调查了海军部队在空中、水面和电磁战领域通过执行战术进攻行动和使用欺骗战术对 DMO 做出贡献的能力。分析得出两个主要结论。在部队构成方面,导弹运载资产数量的增加对作战效能和生存能力的影响最大。在战术上,电子干扰的使用加上无人欺骗群的使用,极大地提高了友军资产的生存能力以及敌军部队的损耗。

图1所示。基于事件的DMO模型的功能

在一个主要军事力量之间经常发生挑战的动态和不确定的全球环境中,不能期望海域主要由美国的海上力量控制。海上势力范围的竞争环境要求对当前和预计未来的武器系统和网络能力进行持续创新。海、空、水下、电磁和网络领域的挑战促使美国继续发展创新的作战概念和条令,努力保持世界海军强国的领先地位。分布式海上作战(DMO)概念的提出是为了通过建立一个跨所有作战领域的分布式协作集成平台网络来增强美国海军的进攻能力。

根据 OPNAV 项目发起人的要求,系统工程分析第 27 组顶点小组的目标是开发一个由有人和无人系统组成的体系,用于在 2030-2035 年期间构建分布式海上作战体系。该团队将分析和评估不同平台的各种组合在有争议的环境中执行战术进攻行动的能力。该小组的工作重点不是设计和采购新平台,而是执行欺骗性战术、整合有人和无人资产,以及应用战术进攻能力对付有能力的对手部队,努力发展一支更具杀伤力和生存能力的海军部队。

A. 分布式海上作战

为了让团队开发出一个有助于执行分布式海上作战能力的系统体系,DMO 的构建需要进一步详细界定和定义。在本 "顶点 "项目的范围内,DMO 被视为一种运用概念,在这种概念中,多领域平台和技术被整合和利用,目的是提高总体杀伤力,同时降低遭受对手攻击的可能性。执行 DMO 的系统体系能够投射进攻性火力,并由跨所有作战领域的统一海军部队在大面积地理区域内实施集体防御。DMO 作为一种创新概念与当前海军部队行动的主要区别在于,其主要原则是赋予操作人员和指挥官权力,使其能够利用现有技术,在有能力的情况下在交战中采取进攻行动,先发制人,努力在与有能力的对手作战中取胜。

DMO 概念不仅将进攻性打击视为在战斗中获胜的主要战术,还将欺骗和迷惑敌人的能力确定为在有争议的环境中取得成功的关键任务。在本研究中,DMO 的运用被分解为三个主要功能;反措施、反目标和反介入。对于敌对双方部队之间的交战,每种功能都有不同的目的,并产生不同的预期结果。反措施属于防御性质,目的是在敌方威胁的武器交战发生后转移敌方资源。采用反措施的目的是分散或削弱敌方系统,以防止敌方已经采取的行动。相反,反瞄准则是在敌我力量交战时采取更具进攻性的姿态。反瞄准被认为是友军先发制人采取的行动,目的是防止敌方武器发射指向实际的蓝军资产。这种反瞄准目标可通过采用欺骗性战术和行动演习来实现,从而转移或阻止敌方以友军的独立单元或群体为目标。研究报告中 DMO 的最后一个要素是反介入,它描述了友军为解除威胁以排除敌方平台任何潜在武器发射而采取的行动。本项目将上述 DMO 的每项原则都视为必要功能,以提高在充满挑战的海洋环境中开展分布式行动的能力。

正如 DMO 概念中的反介入、反瞄准和反措施部分所述,"顶点 "项目的主要重点是采用各种欺骗方法和战术,努力影响友军在战斗中取得成功。SEA-27 小组将这些欺骗战术分为四大类:无人资产群、机械和物理反制措施、电子干扰和限制电磁辐射或发射控制 (EMCON)。对每一种战术都进行了研究,以确定这些反目标行动和防御性反措施对友军在整个交战期间保持行动和作战能力的影响。

B. DMO 模型与模拟

为了分析和评估由多领域平台组成的各种部队架构的效用,团队使用名为 ExtendSim 的离散事件模拟程序构建了一个基于事件的模型,以表示舰队与近邻对手的舰队对舰队交战。SEA-27 小组开发的 ExtendSim 交战模拟考虑了友方和敌方的作战指令,包括预计在 2030-2035 年期间投入使用的主要平台、传感器和武器系统。此外,还对之前描述的战术的使用进行了建模,以深入了解在各种生存能力和杀伤力性能指标方面使用欺骗性措施的潜在价值。

为了对友军反措施、反瞄准和反交战战术的有效性进行详细分析,"顶点 "团队建立了一个以执行敌方杀伤链为重点的仿真模型。该模型表示了敌方在水面、空中和导弹领域的威胁,它通过杀伤链的各个阶段,以攻击指定的蓝军平台为目标。如图 1 所示,杀伤链序列包含敌方威胁必须执行的主要功能,包括发现、瞄准和最终攻击指定的友军资产。在确定特定交战结果时,要考虑敌方威胁和友军资产的相对性能参数,包括友军在杀伤链各阶段可能采用的各种战术和反制措施。在敌方威胁通过杀伤链的各个阶段实施欺骗和转移方法,可使友军降低或破坏敌方执行发现、瞄准和交战功能的能力。在模拟中应用各种逻辑语句和设置,有助于检查以 DMO 为中心的前沿友军对总体成功衡量标准的影响。

通过 ExtendSim 模型的数据输出和多元回归分析的应用,可以对基准固定兵力结构和可变兵力结构进行评估。基线部队结构由一组固定的友军舰船和飞机组成,按传统的行动编队排列,包括航母打击群、远征打击群、水面行动群和各种独立的可部署单元。对固定兵力结构进行研究的自变量包括各种战术,如使用干扰、可用物理反制措施的数量、EMCON 分配和蜂群资产的部署。DMO 的可变兵力结构由水面、空中和无人资产的任何潜在组合以及相关的可使用战术和反制措施组成。分析可变兵力结构时考虑的输入变量包括前文所述的战术,以及水面和空中领域的可变平台数量。通过对这两大类兵力结构的分析,研究小组确定了有助于友军成功完成任务的重要统计因素或战术和平台,以及采用各种平台组合及相关战术和欺骗性措施的作战影响。

C. 结论

通过对固定和可变兵力结构的分析,有几个因素被认为对各种兵力组合执行 DMO 的能力具有重要的统计和作战意义。就友军的生存能力而言,使用干扰和欺骗性蜂群对作战效能的影响大于任何机械或物理对抗措施或任何经分析的电磁控制技术。对敌方威胁实施干扰可扰乱杀伤链的发现和瞄准阶段,导致发现和/或攻击指定蓝军资产的时间延迟。敌方威胁在瞄准阶段的时间延迟导致友军有更多机会进行反介入,以便在导弹或武器介入前解除或摧毁威胁。此外,蜂群的存在会造成更多的接触和杂乱,这就要求敌方投入更多的时间和资源来识别蜂群中的每辆车并将其分类为敌方或友方。同样,这种对威胁造成的延迟也有利于友军实施进攻性打击,并对来袭威胁进行分层防御。

主要的导弹携带水面平台,特别是巡洋舰和驱逐舰,在交战场景中采取进攻姿态时,会产生最大的统计和作战影响。友军在生存能力和杀伤力方面能否取得成功,取决于导弹航母在进攻性和防御性武器方面的重大贡献,以及对共同作战和火控网络的贡献能力。导弹航母具有远程攻击能力,是大范围内部队集体防御的主要基础。此外,在整合无人资产方面,导弹航母可作为部署和控制无人资产的母平台。

SEA-27 小组是在分析了对有能力的对手实施 DMO 的因素的统计和作战意义的基础上提出这些建议的。在干扰方面,至关重要的是不仅要研究针对对手使用电磁辐射的方法,还要考虑防御类似攻击的能力。由于严重依赖网络进行通信和共享共同作战画面,必须降低易受干扰的程度,以防止因无法自由使用电磁频谱而丧失能力。无人资产和技术虽然在交战模拟中主要作为杂波建模,但在 ISR 能力和提高杀伤力方面可作为友军作战能力的重要因素。武装无人资产的存在改变了战斗空间的动态,能够有效使用多领域无人飞行器的操作员将获得优势。最后,如果无人资产能够成功地模仿战斗序列中经常成为敌方威胁目标的另一艘舰艇(例如航空母舰),那么所有其他友军平台都会因减少成为敌方威胁的目标和交战而受益。

成为VIP会员查看完整内容
56

Sora推出有望推动内容创作变革也是AIGC组成一部分   2024年2月迎Sora,推动多模态热度。Sora的核心技术是基于OpenAI在自然语言处理和图像生成方面的深厚积累(从LLM的ChatGPT到DALL-E3,再结合Diffusion和Transformer模型)与Runway、Pika等相比,Sora在视频生成的真实感、细节表现上均具标志性价值。AI视频生成虽不是新事,但Sora的推出具有新里程碑价值,作为AIGC组成部分,有望推高AI多模态的热度,可关注AI多模态应用塑造数字内容生产与交互新范式,赋能视觉行业,从文字、3D生成、动画电影、到长短视频、剧集等方面,均有望带来内容创作的变革,助力内容消费市场的繁荣发展,也在加速拓展AI应用新边界(从中长期看,真人生产的内容对比AI生成内容的稀缺性也是凸显)。同时,AI的发展,需要算力等支持,若算力获得持续赋能,应用也有望百花齐放。   以Sora为支点有望撬动AI多模态应用新热度     每一次技术的进步与推动均有望带来时代的红利,AI多模态的应用有望在2024年持续,对传媒领域有望带来存量的提质增效以及新增的应用场景,有望推动传媒走向智媒。从投资维度看,第一维度,OpenAI的产品迭代,微软受益,A股映射的受益公司是与微软合作的蓝色光标;第二维度,内容应用,核心看三点,第一点,对于动画电影带来产能提升,如光线传媒;第二点,对于静态文字领域商业新增量,如中信出版、新经典、果麦文化等;第三点,Sora的AI生成视频模型,人人成为UGC及PGC制作者,有利于丰富元宇宙、长短视频、MR应用生态,虚实融合如风语筑、蓝色光标、浙文互联、力盛体育等。

成为VIP会员查看完整内容
62

人工智能生成内容(AIGC)的发展得益于模型算法的进步、可扩展的基础模型架构以及大量高质量数据集的可用性。尽管AIGC取得了显著的性能,但仍面临一些挑战,例如维护最新和长尾知识的困难、数据泄露的风险以及与训练和推理相关的高成本。最近,检索增强生成(RAG)作为一种应对这些挑战的范式出现了。特别是,RAG引入了信息检索过程,通过从可用的数据存储中检索相关对象来增强AIGC结果,从而提高准确性和鲁棒性。在本文中,我们全面回顾了将RAG技术集成到AIGC场景中的现有工作。我们首先根据检索器如何增强生成器对RAG基础进行分类。我们提炼了各种检索器和生成器的增强方法论的基本抽象。这种统一的视角包括了所有RAG场景,阐明了助力未来进展的进步和关键技术。我们还总结了RAG的额外增强方法,促进RAG系统的有效工程实施。然后,从另一个视角,我们调查了RAG在不同模态和任务中的实际应用,为研究人员和从业者提供宝贵的参考。此外,我们介绍了RAG的基准,讨论了当前RAG系统的局限性,并提出了未来研究的潜在方向。项目仓库:https://github.com/hymie122/RAG-Survey。

近年来,人工智能生成内容(AIGC)引起了广泛的兴趣。各种内容生成工具被精心设计,以在不同的模态中生成多样化的对象,例如包括GPT系列[1]-[3]和LLAMA系列[4]-[6]的大型语言模型(LLM)用于文本和代码,DALL-E[7]-[9]和Stable Diffusion[10]用于图像,以及Sora[11]用于视频。"AIGC"这个词强调的是内容是由先进的生成模型而非人类或基于规则的方法产生的。这些生成模型由于采用了新型模型算法、广泛的基础模型架构和大量高质量数据集而取得了显著的性能。特别是,序列到序列的任务已从使用长短期记忆(LSTM)[12]网络转移到基于Transformer的模型[13],而图像生成任务已从生成对抗网络(GAN)[14]转移到潜在扩散模型[10]。值得注意的是,基础模型的架构最初由数百万参数[15]、[16]组成,现在已发展到包含数十亿参数[1]、[4]。这些进步进一步得到了丰富、高质量数据集[1]、[17]的支持,这些数据集提供了大量的训练示例以充分优化模型参数。

信息检索是计算机科学领域内另一个关键的应用。与生成不同,检索旨在从庞大的资源池中定位相关的现有对象。检索的最常见应用在于网络搜索引擎,主要关注文档检索任务[18]、[19]。在当今时代,高效的信息检索系统能够处理高达数十亿[20]、[21]的文档集合。除了文档外,检索也已被应用于其他模态[22]-[25]。 尽管先进的生成模型取得了显著的进展,AIGC仍面临一些众所周知的挑战,包括维护最新知识的挑战、无法融合长尾知识[26],以及泄露私有训练数据的风险[27]。提出检索增强生成(RAG)以缓解,如果不是完全解决,上述挑战,通过其可适应的数据仓库。用于检索的知识可以被概念化为非参数记忆。这种形式的记忆易于修改,能够容纳广泛的长尾知识,并且也能编码机密数据。此外,检索也可以用来降低生成成本。例如,RAG可以减小大型生成模型的大小[28],为长上下文提供支持[29],并省略某些生成步骤[30]。

典型的RAG过程如图1所示:给定一个输入查询,检索器定位并查找相关数据源,然后检索结果与生成器交互,以增强整体生成过程。检索结果可以以不同的方式与生成过程交互:它们可以作为增强输入供生成器使用[31]、[32];它们可以在生成的中间阶段作为潜在表示加入[33]、[34];它们可以以逻辑形式贡献于最终生成结果[35]、[36];它们甚至可以影响或省略某些生成步骤[30]、[37]。此外,在典型的基础RAG过程之上,也提出了许多增强方法以提高整体质量。这些增强包括针对特定组件的方法以及针对整个管道的优化。 虽然RAG的概念最初出现在文本到文本的生成中[32],但它也已被适应到各种领域,包括代码[38]-[40]、音频[41]、[42]、图像[43]-[45]、视频[46]、[47]、3D[48]、[49]、知识[50]-[52]和AI科学[53]、[54]。特别是,RAG的基本思想和过程在模态之间大体一致。然而,它需要在增强技术上进行特定的小调整,而检索器和生成器的选择则取决于特定的模态和任务。

尽管近期关于RAG的研究迅速增长,但一个涵盖所有基础、增强和应用的系统性综述显然是缺失的。对RAG基础的缺乏讨论显著削弱了这一领域研究的实际价值,使RAG的潜力没有得到充分探索。虽然大多数研究兴趣,特别是在LLM研究人员中,集中在文本生成任务中基于查询的RAG上,但认识到其他RAG基础范式也是有效的技术,并具有显著的使用和进一步发展潜力是至关重要的。对RAG应用的概述缺乏导致研究人员和从业者忽视RAG在多个模态中的进展,并且不了解如何有效地应用RAG。尽管文本生成通常被视为RAG的主要应用,我们强调RAG在其他模态的发展也在早期阶段开始,并已取得了有希望的进展。某些模态与检索技术有着丰富的历史联系,为RAG注入了独特的特征。尽管已经提出了一些关于RAG的调查,但它们主要关注于特定的方法论和任务。在本文中,我们的目标是提供一个全面的调查,以提供RAG的系统性概述。

这篇综述提供了关于RAG的全面概览,涵盖了基础、增强、应用、基准、局限性和潜在的未来方向。尽管检索器和生成器在不同的模态和任务中展现出变化,我们提炼了RAG基础的基本抽象,将应用视为源自这些抽象的适应。我们旨在为研究人员和从业者提供参考和指南,为推进RAG方法论及其相关应用提供有价值的见解。总结来说,我们的贡献如下: 我们对RAG进行了全面的回顾,并提炼了各种检索器和生成器的RAG基础抽象。 我们总结了现有RAG流程的增强,详细说明了用于实现更有效RAG系统的技术。 对于不同的模态和任务,我们调查了融合RAG技术的现有AIGC方法,展示了RAG如何为当前的生成模型做出贡献。 我们讨论了RAG的局限性和有前景的研究方向,阐明了其潜在的未来发展。

这篇综述提供了关于RAG的全面概览,涵盖了基础、增强、应用、基准、局限性和潜在的未来方向。尽管检索器和生成器在不同的模态和任务中展现出变化,我们提炼了RAG基础的基本抽象,将应用视为源自这些抽象的适应。我们旨在为研究人员和从业者提供参考和指南,为推进RAG方法论及其相关应用提供有价值的见解。总结来说,我们的贡献如下: * 我们对RAG进行了全面的回顾,并提炼了各种检索器和生成器的RAG基础抽象。 * 我们总结了现有RAG流程的增强,详细说明了用于实现更有效RAG系统的技术。 * 对于不同的模态和任务,我们调查了融合RAG技术的现有AIGC方法,展示了RAG如何为当前的生成模型做出贡献。 * 我们讨论了RAG的局限性和有前景的研究方向,阐明了其潜在的未来发展。

方法

在本节中,我们首先在AIGC的背景下介绍RAG的基础。随后,我们概述了进一步提高RAG有效性的增强方法。根据检索器如何增强生成器,我们将RAG基础范式分类为4个不同的类别,如图6所示。

在本节中,我们将介绍用于增强RAG性能的方法。我们根据增强目标将现有方法分为5个不同的组别:输入、检索器、生成器、结果和整个流程。

结论

在本文中,我们对与AIGC相关的场景中的RAG进行了全面和深入的调查,特别关注增强基础、增强措施和实际应用。我们首先系统地组织和总结了RAG的基础范式,提供了关于检索器和生成器之间互动的见解。基于构建的RAG系统,我们回顾了进一步提高RAG有效性的增强措施,包括对输入、检索器、生成器和结果的增强。为了便于跨不同领域的研究人员,我们展示了在多种模态和任务中RAG的实际应用。最后,我们还介绍了RAG的现有基准,讨论了RAG当前的局限性,并展望了有前景的未来方向。

成为VIP会员查看完整内容
58

分布式海上作战(DMO)是美国海军部(或称 DON,包括海军和海军陆战队)的作战概念,旨在利用美国海军(即海军和海军陆战队)部队在作战行动中打击对手,尤其是大国,因为对手拥有强大的能力,可以用反舰导弹和其他武器探测和攻击美国海军水面舰艇。美国国会面临的一个问题是,国会是否掌握有关 DMO 的足够信息以评估其优劣,以及美国国防部是否已根据 DMO 充分调整了其计划和预算。

术语:作战概念

作战概念是关于如何使用特定军事力量(此处指美国海军部队)开展行动,特别是在作战情况下开展行动的总体想法。作战概念可以支持实施打击特定冲突的战略或战争计划,单个军事单元(如海军舰艇和飞机)使用的战术可以反映作战概念。

DMO:简介

美国海军作战部长的一份 2022 年文件将 DMO 称作 "海军的基础作战概念"(海军作战部长,《2022 年导航计划》,第 8 页)。美国海军司令部尚未发布关于 DMO 的详细非保密说明。海军司令部官员的声明表明,DMO 的一个关键目标是提高美国海军部队对抗大国海上反介入/区域拒止(A2/AD)系统(即探测和攻击美国海军水面舰艇和飞机的能力)的能力,从而使美国海军部队在与大国冲突期间能在大国 A2/AD 系统射程内的水域有效作战。DMO 的主要特点似乎包括以下几点:

  • 将海军单元分散到战区内更大的区域,使敌方更难发现和瞄准海军单元,同时仍允许海军单元相互支援并集中火力打击敌方目标。

  • 将海军的传感器和武器分散到更多的舰船和飞机上,以减少因任何一艘海军舰船或飞机被摧毁而损失的海军传感器和武器的比例(即避免 "把太多鸡蛋放在一个篮子里")。

  • 更多地使用射程更远的武器、无人舰艇和无人飞机,以支持前两点。

  • 利用弹性通信链路和网络技术,将由此产生的广泛分散的有人和无人舰船和飞机编织成一支协调的战斗部队,能够抵御和适应敌方对海军通信和网络的攻击。

一位观察家在撰写有关 DMO 的文章时(见下文 "其他资源 "方框中的 Filipoff)指出,"[海军]对 DMO 的解释包含几个决定性特征,这些特征在海军对这一概念的公开定义中始终占据重要地位。这些特征包括:集结和汇聚来自分布式部队的火力,使对手的目标锁定和决策复杂化,以及跨平台和跨领域的网络效应"。

其他美国军种作战概念

美国其他军种也有在未来潜在冲突中开展各自行动的作战概念。美国空军的概念是 "敏捷战斗部署"(ACE),陆军的概念是 "多域作战"(MDO)。在美国国防部内部,海军陆战队有一个称为 "远征先进基地作战"(EABO)的概念,与 DMO 相辅相成。各军种的作战概念有一些共同点,包括更多地使用无人系统,以及利用通信和网络技术将分散的单元整合成协调的作战部队。

与 DMO 有关的一些海军采购计划

与美国《国防现代化条例》有关的海军采购计划包括以下几个例子:

  • 获取射程更远武器的计划,如 "海上攻击战斧"("战斧 "巡航导弹的新型反舰变体)和远程反舰导弹(LRASM)。

  • 大型无人水面舰艇(LUSV)将配备垂直发射系统(VLS),用于储存和发射反舰导弹和其他武器。LUSV 旨在充当有人驾驶的海军水面作战舰艇的辅助导弹库。

  • 中型无人水面舰艇(MUSV),将配备雷达或其他传感器。中型无人水面舰艇旨在帮助形成一个分布式传感器网络,为海军行动提供支持。

  • 轻型补给油船(TAOL)造船计划旨在建造一种新型的小型油船。轻型补给油船(TAOL)旨在提高海军向在更广阔海域以更分散方式执行任务的海军舰艇提供燃料和补给的能力。

  • 中型登陆舰(LSM)计划旨在建造一种小型两栖舰艇。LSM 计划是实施 EABO 的核心。

美国国会可能面临的问题

美国国会对 DMO 的潜在监督问题包括但不一定限于以下方面:

  • 国会是否从海军那里获得足够的关于DMO的信息来评估其优点?海军是否向国会提供了详细描述 DMO 的机密报告?海军是否应公布关于 DMO 的非机密描述?

  • 美海军进行了哪些分析,导致海军采用 DMO 作为其基本作战概念?海军演习在多大程度上证实了这些分析?

  • DMO 是否与空军的 ACE 概念和陆军的 MDO 概念充分协调?各军种正在采取哪些措施协调其概念?

  • 美国防部的预算和计划是否与 DMO 充分协调?国会是否有足够的关于 DMO 的信息来评估这个问题?DMO对海军的造船和武器采购计划以及相关的造船和武器制造工业基地有什么影响?

  • 在未来 5 到 10 年内,美海军实施 DMO 的能力会在多大程度上受到海军库存远程武器数量限制的制约?根据目前海军采购新武器的计划,这种限制会以多快的速度得到缓解?

  • DMO 所需的通信和网络技术有哪些技术挑战和风险?DMO 是否充分考虑了战时因敌方攻击而导致网络退化的可能性?

  • 一位观察家在撰写有关 DMO 的文章时指出:作战概念可能会被滥用,只不过是为先入为主的利益服务的举措上的保险杠贴纸。DMO 发生这种情况的风险有多大?

  • 为了帮助实施DMO,一些观察家建议在目前没有导弹系统的舰艇上(如两栖舰或辅助舰)增加导弹系统,或为濒海战斗舰(LCS)配备射程比其目前携带的导弹更远的导弹。这些建议的相对优点是什么?

成为VIP会员查看完整内容
55

 核心观点   事件:2024年2月16日,OpenAI发布文生视频模型——Sora及其技术报告《Video generation models as world simulators》。   从Sora模型看文生视频的技术路径:技术路径尚未收敛,Transformer扩展特性优势凸显。市场大多认为扩散模型是图像和视频生成领域的主流路径,但没有重视Transformer架构scaleup的能力。OpenAI技术报告指出,Sora是基于扩散模型,但更强调,Sora是一个基于Transformer架构的扩散模型,其优秀的生成能力离不开Transformer架构优秀的scaling特性。当前,为构建性能更优、效率更高的视频生成模型,已出现多种结合Diffusion Model和Transformer架构的构建方式。   从Sora模型看文生视频的最新能力(假设展示视频可以代表Sora的一般性表现):1)强大的理解能力:Sora模型不仅可以理解Prompt的内容,还能理解事物在物理世界中的存在方式,突出的语言理解能力是其能够准确生成视频的前提。2)优秀的生成能力:①长度:可生成60s视频;②复杂度:能够生成包含多个角色、多种主题、多类运动形态的复杂场景;③逼真度:能够呈现更多的视觉细节,具备更高清的画质,为用户提供逼真的视觉体验;④连贯性&一致性:可以生成同一角色的多个镜头,保持其在整个视频中的外观,在角度移动和切换情况下,人物和场景元素在三维空间中的位置关系能够保持一致的运动;⑤可控性:在某一Prompt基础上只改动一个关键词仍能生成优质的视频,具备较好的可控性。3)其他能力:图生视频,视频扩展/编辑/拼接/模拟等。   从Sora模型看文生视频的行业影响:目前OpenAI已向部分视觉艺术家、设计师和电影制作人提供访问权限,以获取专业的反馈。我们认为,以Sora为代表的视频生成模型有望给广告/设计/短视频/游戏等行业带来变化。从中短期来看,视频生成模型将更多的作为创作工具对相关行业进行赋能。

成为VIP会员查看完整内容
55

本手册旨在帮助电子战和雷达系统工程师对系统能力进行一般估计。本手册由 NAVAIR 电子战/战斗系统部主任赞助。章节包括:基本原理;天线;雷达方程;雷达与接收机特性及测试;微波/射频组件;电光红外;飞机动力学考虑;数据传输总线;词汇表;缩写和缩略语。

成为VIP会员查看完整内容
53

🌟 人工智能大模型作为技术发展的重要引擎,正推动各行各业的革命性变革。🔍 国内大模型发展迅速,中美两国在全球大模型数量上占据主导地位。🤖 百度、阿里、腾讯、华为等科技巨头纷纷推出各自的大模型产品,如“文心一言”和“通义千问”。📈 人工智能人才需求激增,国内人才缺口巨大,预计到2025年将突破1000万。🎓 国家层面的人才培养工作正在加强,新职业的认定和技能标准制定正在进行中。🔧 企业、院校和行业协会合作,共同探索产教融合的人才培养新模式。🌐 人工智能大模型技术人才培养模式正面临创新,以适应行业发展和市场需求。

成为VIP会员查看完整内容
49

这项研究的目的是调查和开发适合设计和分析低可观测无人作战飞行器(UCAV)的概念设计方法和计算工具,这些飞行器可执行从亚音速到高超音速飞行状态的各种任务,具有各种有效载荷和性能要求,以及各种操作限制

毫无疑问,无人驾驶飞机已经改变了航空航天的许多方面,而军事应用往往引领着这些变革努力。UCAV 已成为应对未来空战所面临的技术、作战和经济挑战的潜在战略。这些挑战包括第四代战斗机机队的老化、新型先进 4+ 和第五代平台的部署、据报道当前无人飞行器的高脆弱性以及高超音速飞行器和武器的未来发展。

为了研究未来飞机的配置,克兰菲尔德大学飞机设计组的霍华德-史密斯教授于 2012 年设想了 GENUS 飞机设计环境。该框架依赖于一个具有高度模块化和灵活性的中央架构,能够使用类似的分析工具设计、分析和优化多个种类的飞机,揭示新设计的真正差异和潜在优势。

质量估计、推进、空气动力学、性能、雷达截面估计和气动热分析工具已集成到 GENUS 框架中,以研究 UCAV 的设计空间。由于获取 UCAV 和类似配置的高质量数据往往受到限制,因此无法对这些方法进行验证,也无法从中比较和生成更高保真的模型。第9.2节确定并提出了今后提高这些方法准确性的具体步骤。

本研究进行的设计空间探索包括:亚音速 UCAV 执行高-低-高任务的任务参数权衡研究、性能与当前第五代战斗机相当的 UCAV 平台的概念和初步设计、全超音速深度拦截任务权衡研究,以及执行时间紧迫的打击任务的高超音速(M ≥ 3.0)舰载 UCAV

图 UCAV 完整的结构布置(改编自 Sleightholme)。

提纲

第 2 章简要介绍了无人飞行器的发展历史,强调了从最早的空中鱼雷到现代冲突的军事应用。随后,在本研究的背景下对 UCAV 进行了定义,并对联合行动的未来进行了简要展望。还介绍了主要的技术验证计划和当前的 UCAV 设计。本节最后回顾了设计和开发 UCAV 背后的技术挑战。

第 3 章介绍了 GENUS 飞机设计环境、其核心理念、总体结构概述、数据分层和模块之间的数据共享,最后介绍了框架内优化问题的设置;并提供了一个准多目标优化的简要示例。

第 4 章提供了集成到 GENUS 框架各分析模块中的 UCAV 设计方法的技术细节;提供了质量估计、空气动力学、推进建模和雷达截面的验证和确认。由于 UCAV 配置具有从亚音速到高超音速的广阔设计空间,因此在开发这些方法时考虑到了灵活性和可扩展性。除了典型的飞机设计分析模块外,还创建了一套特殊模块来分析非典型学科:通过物理光学近似方法增加了雷达截面估计;作为高超音速运行的一个关键方面,还包括飞行器热负荷分析和燃料热管理系统。

第 5 章介绍了典型对地打击任务(Hi-Lo-Hi)中低可观测亚音速 UCAV 配置的任务和性能权衡研究。在机翼面积不变的情况下,量化了前缘掠角、巡航马赫数、作战半径和比过剩功率对λawing UCAV配置的影响。

第 6 章介绍了为建立第五代 UCAV 设计所做的概念和初步设计工作,该设计旨在与当前的第五代战斗机和未来的第六代战斗机一起进行高度集成和协调的作战行动。这种 UCAV 的任务设计包括亚音速对地攻击剖面和有限的超音速作战能力。已对总体结构概念、发动机尺寸和集成、燃料、动力和执行系统以及起落架尺寸和航电系统设计进行了初步设计研究。

第 7 章涉及各种作战任务、有效载荷和操作要求下的超音速设计概念研究。对马赫数 2.0 的深度拦截任务(Hi-Hi-Hi)进行了研究,并对巡航和冲刺马赫数进行了作战贸易研究。随后,还介绍了航母舰载高超音速打击 UCAV 的作战贸易研究。评估了巡航马赫数、巡航高度和作战半径对重要性能参数(如到达目标时间和热管理限制)的影响。

第 8 章是主要讨论部分,总结了在各种任务和作战限制条件下各类 UCAV 的主要结果和发现。

最后,第 9 章总结了成果、结论和确定的下一步工作。

GENUS飞机概念设计环境

克兰菲尔德大学飞机设计组自 2012 年起开始开发 GENUS 飞机概念设计环境(122)。其名称源于生物分类学的分类方法,代表了在通用架构下设计、分析和优化各种飞机的能力,如图 3-1 所示。

图 3-1 - 适用于飞机的生物分类法

GENUS 是基于 Java 的代码,因此无需客户许可证即可在任何操作系统中运行。Java 的在线支持和开发非常广泛,有多个数值、数学、图形和后处理库可供免费使用,大大提高了框架的潜在能力,同时降低了开发成本。

图 3-2 - Java 与传统代码交互的一般程序

另一个重要特点是 Java 能够通过其 Java 本地接口 (JNI) 实现与 FORTRAN 和 C/C++ 等其他编程语言进行通信。图 3-2 显示了 Java 与传统飞机设计代码(通常用 C、C++ 和 FORTRAN 编写)之间的集成和通信过程。该功能广泛应用于 GENUS 框架的各个分析学科,以增加保真度,而无需长时间重写或独立开发复杂代码。

GENUS 架构的核心理念可概括为以下几个主要方面:

  • 模块化: 明确区分不同的分析学科,并按层级编程。抽象类是这一功能的基础,Java 的多态性也为其提供了支持。

  • 灵活性: 通过高度抽象化,分析技术可应用于多种飞机,而无需修改核心框架。

  • 扩展性: 能够在分析模块中包含各种保真度级别,从经验方法到高保真数值工具。Java 的本地接口及其多态性支持这一方面。特殊模块(下文将解释)可用于添加专业分析工具。

  • 健壮性: 一个有凝聚力的框架,依赖于经过良好测试的方法以及适当的错误和异常处理方法。

  • 独立性: 在适当情况下,避免使用许可和依赖平台的软件。

图 3-3 - GENUS 框架的组成部分和相互关系

GENUS 框架不应被视为一个黑盒系统,只需要用户提供最少的输入;相反,GENUS 依赖于一个知识渊博的用户/设计者,以循环和建设性的方式与框架的前端和后端进行交互。这种互动利用了设计者的专业知识、直觉和假设,从而产生新的知识。图 3-3 是用户与框架互动的顶层示意图。

GENUS 核心框架由九个基本模块组成,其中包括 1. 几何 2. 任务 3. 推进规范 4. 质量分解 5. 空气动力学 6. 推进分析 7. 包装 8. 性能 9. 稳定性

所有模块都采用抽象 "GENUS模块 "的结构,如图 3-4 所示。随后,9 个基本模块中的每一个都有一个 "抽象 "模块。如图 3-5 所示,所有特定模块都是这些抽象模块的扩展和实现。

图 3-4 - 抽象 "GENUS模块 "的总体结构

图 3-5 - 性能模块的层次结构和数据流

为了分析飞机设计的非常规方面,可以在原有 Genus 模块的基础上实施一系列特殊模块。特殊模块的例子包括雷达截面分析、音爆强度、成本估算和航空热力学分析。

图 3-6 是一个框架示意图,显示了单个设计实例的启动过程。每个模块都可以根据用户的需要进行输入,然后将输入信息传递到后续模块,如连接箭头和变量所描述的信息流所示。

图 3-6 - 在 GENUS 中启动设计实例的 N2 图示例

图 3-7 显示了带有几何和体积约束、质量和燃料收敛误差以及推力和稳定性约束的优化循环的 N2 图。输入变量仅与几何、任务(估计起飞质量)和推进规范模块相对应。该图表示一个固定飞行任务(航程、速度、有效载荷......)的典型收敛优化循环。目标函数箭头来自框架域,一般代表可选择的各种目标;典型目标函数的例子包括最大起飞质量 (MTOM)、运行空重 (OEM)、总耗油量、RCS(特定视角或平均值)等。

图 3-7 - GENUS 优化设计的 N2 图示例

成为VIP会员查看完整内容
51
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员