随着大型模型在各行各业的广泛应用,基于大型模型的人工智能体(AI Agent)迎来了快速发展的阶段。研究AI Agent是人类不断接近人工通用智能(AGI)的探索之一。知名AI Agent项目AutoGPT已经在GitHub的星星数已经达到 140,000 颗,进一步反映了用户对于AI Agents 项目的广泛兴趣和支持。 随着AI Agent变得越来越易用和高效,"Agent+"的产品越来越多,未来AI Agent有望成为AI应用层的基本架构,涵盖toC和toB产品等不同领域。LLM是Agent能力的增效器,交互协作程度是Agent能力的扩展器当下大模型的参数量提升AI Agent的理解力和泛化能力,使其能更好地处理多种任务和上下文信息。这增强了AI代理的自然语言处理能力,从而 提供更个性化、连贯的交互体验,是当下Agent的构建关键。AI Agent将给应用软件的形态和业态带来颠覆性变化,成为垂直应用的超级入口AIGC将给应用软件的形态和业态带来颠覆性变化。基于自然语言的极简交互将替代很多传统的图形界面交互,形成LUI+GUI的混合形态,未来, 诸如硬件入口、汽车入口等,手机制造商可能都会做Agent store;AI Agent形态可以对既有软件进行智能化改造与升级,以API 的形式增加重要环节的可交互性和认知能力;也可以对软件的应用架构和模式进行 全新重构。业务流程和个人交互方式的改变对用户体验影响巨大,可快速调取超级应用承载的海量复杂功能,形成组合式输出。典型场景分析-多智能体(Multi-Agent)实现模拟人类工作流程模拟人类工作流程:可以模拟人类的分工协作方式,将各种任务的标准操作流程编码为AI Agent的“规范手册”,使得AI Agent性能大增。 * 专业化角色分配:不同的AI Agent可以被赋予不同的角色和职责,使得每个AI Agent都能够专注于其领域内的具体任务,从而提升整体系统的效率和输出质量。 * 提高决策和执行的效率:通过角色专业化,复杂的任务被分解为更小、更具体的子任务,AI Agent可以并行处理这些任务,提高了任务执行的速度和质量。 * 增强任务理解和推理能力:过角色扮演和通信拓扑的设定,增强了任务理解和推理决策能力,尤其是在需要多步骤逻辑推理的复杂任务中。 * 结构化输出和通信:采用结构化的输出和通信协议,提高了信息的清晰度和完整性,减少了信息在传递过程中的丢失和歧义。 * 可执行反馈和自我优化:具备根据环境反馈进行自我优化和主动更新的能力,这在软件开发等任务中尤为重要,可以自动进行代码质量的优化。 * 消息共享和发布-订阅机制:通过引入消息共享的发布-订阅机制,AI Agent可以更高效地交换信息,避免了无效重复和无限循环的问题,同时提升了通信效率。 * 解决复杂任务:可以将复杂任务分解为由不同角色执行的子任务,并让不同的AI Agent完成不同的子任务,这种协作方式对于编写软件等复杂任务非常有效。 * 提高创造力和适应性:通过AI Agent之间的互动和协作,能够产生新的创意和解决方案,提高了系统对新情况的适应性。

AI Agent领域成为实现AI价值的重要赛场,不同类型企业各显身手中国当下的AI Agent市场已经迎来丰富的参与者,包括互联网大厂类、生成AI类、企服SaaS类、创业类、3C类等多类型企业,这些企业依据自身 技术或行业know-how迅速切入市场,通过先手占据更好的生态占位;并且越来越多的企业正在进行产品打磨与场景探索。随着这些先行者的商业价值逐步展现,中国的AI Agent的多样性将进一步丰富,企业数量将迎来爆发。AI Agent的发展基础:数据与算法持续增长全球数据量未来5年将持续增长,2022年,全球数据规模已达到103ZB,中国数据规模达到23.9ZB;预计2027年,全球数据规模可达到284.3ZB, 2022-2027的复合增长率可达到22%,而中国数据量规模则可达到76.6ZB,2022-2027的复合增长率为26%,超过全球增长速度。国产大模型自2023年7月开始进行密集发布,并且涉及金融、法律、教育、医疗、娱乐等多个垂直细分领域。AI Agent的探索机会:生成式AI技术推动了人工智能的场景应用价值发展生成式AI的出现对所有行业的生产模式均进行了颠覆,并且从内容生成到流程再造,可实现多个行业的成本降低及价值再造,其中蕴含了大量的 机会,而AI Agent作为商业落地的第一站,将在多个垂直领域发挥作用。

成为VIP会员查看完整内容
66

今日,腾讯研究院正式发布《向 AI 而行,共筑新质生产力——行业大模型调研报告》,前后历时近1年研究,基于对超过百名各界专家访谈(百人百问),深入剖析了行业大模型的发展背景、应用进展、实现方式、安全与治理,以及未来的发展趋势,旨在为业界提供囊括学术、商业、政策等不同视角的全面参考。

报告亮点

本报告综合技术前沿趋势与行业一线实践,主要形成了十个核心问题的分析探讨: 1)大模型的核心突破是什么?2)为什么需要发展行业大模型?3)行业大模型是什么?4)哪些行业的大模型应用发展快?5)哪些场景的大模型应用发展快?6)不同行业对大模型有没有共性需求?7)如何衡量行业大模型是否成功?8)行业大模型有哪些实现方式?9)行业大模型如何实现负责任的部署和应用?10)行业大模型的未来发展方向是什么?

成为VIP会员查看完整内容
59

标签

人工智能 大模型应用 数据分析 智能客服 企业战略 业务收益 自动化营销 消费者权益保护 数字化转型

一句话总结

《2024 爱分析·大模型应用实践报告》深入分析了人工智能大模型在企业中的落地挑战与应用场景,特别是在数据分析和智能客服领域的实践,展示了如何通过战略一致性、业务收益设定和提升数据分析准确率来推动大模型的商业价值。

摘要

报告综述

  • 描述了人工智能大模型的定义、发展和在不同行业中的初步应用。
  • 强调了大模型在提升模型精度、泛化能力以及赋能行业的潜力。
  • 指出企业对大模型的关注度,尤其是在数据分析和知识库/智能客服场景。

市场洞察

  • 通过调研发现大模型落地应用的挑战,包括与企业战略一致性、业务收益设定和数据分析准确率。
  • 提出解决方案,如战略解码过程、业务收益设定方法和数据分析准确率提升策略。

数据分析市场

  • 讨论了大模型在数据分析市场的应用,包括意图理解、SQL生成和深度分析。
  • 介绍了NL2SQL技术、限定查询边界的解决思路和深度分析的重要性。

知识库/智能客服市场

  • 分析了大模型在知识库构建和智能客服中的应用,强调了降低冷启动时间和全流程赋能的重要性。
  • 描述了智能客服在投诉处理等环节的应用。

案例研究

  • 提供了两个案例,展示了大模型在国有银行理财产品销售和股份制银行消费者权益保护中的应用。
  • 展示了大模型如何提升业务收益和降低客户投诉。

结语

  • 对大模型技术的未来发展进行了展望,提到了OpenAI的文生视频大模型Sora。
  • 强调了爱分析在推动大模型落地进程中的努力和对企业数字化转型的支持。

成为VIP会员查看完整内容
55

在过去几年中,无人机蜂群受到了广泛关注,但对对抗性无人机群(即竞争性无人机群对无人机群游戏)的研究则较少。本文研究了团队对团队无人机空战场景中的影响因素,阐明了交战空间中兵力集中和对手分散的影响。具体来说,本论文有以下贡献:

1.战术分析: 确定了在小到 2 vs.-2 和大到 10 vs.-10 的交战中,明确协调战术或分散、贪婪战术的优势条件,并研究了这些模式如何随着团队武器质量的变化而变化;

2.协调战术: 介绍并演示了一种深度强化学习框架,该框架使智能体学会利用自身和队友的情境来决定在什么情况下采用哪些预先设定的战术,以及在整个交战过程中与哪些队友(如果有的话)进行协调;在 N 对 N 的交战中,在 N 小到 2、大到 64 的情况下,使用在此框架内训练的神经网络的智能体在与采用基线战术的智能体团队的交战中的效能优于基线战术;

3.生物启发协调: 通过基于 Monte-Carlo 智能体的模拟发现,不仅要优先集中团队力量对付威胁最大的对手智能体,还要通过部署较小的防御力量和防御高优先级威胁之外的低处罚威胁来保留一些资源,从而最大限度地利用防御团队燃料库中的剩余燃料。

图 4.7:测试集模拟的注释剧照(蓝队获胜)。请注意,在有注释的智能体集群中,蓝队的智能体(左侧为 PSCE(4-vs.-4 训练有素的 GS))将目标分散到所有靠近的红队成员身上,而对手(右侧为 16 个 GS,红色)则瞄准了最前面的 PSCE 智能体。与 GS 相比,训练有素的 PSCE 智能体更善于将力量集中分散到对手的智能体中。

成为VIP会员查看完整内容
55

目前,将人工智能技术融入美国军队的势头非常强劲。这包括将该技术用于指挥和控制目的。这些努力的前提是人工智能和机器学习能让美国指挥官以更快的速度做出更好的决策。然而,人工智能不断融入军事决策过程,有望将决策要素从人类手中下放,这对强调果断、直觉和大胆指挥官这一英雄原型的长期军事传统提出了挑战。因此,本文试图探讨,面对这些相互竞争的观点,将战争决策权下放给 "智能机器 "的前景是如何获得目前的发展势头的?本文认为,可以通过关注二战后时代出现的特殊战争愿景,特别是与美国军事思想中的速度和知识主题相关的愿景,来解决这一难题。通过结合使用计算文本分析技术和系谱学方法,本文揭示了美国国防架构成员对速度和知识及其与战争关系的构想和优先次序的转变。本文说明,在有关人工智能的优点及其在军事决策中的作用的辩论中,这些变化充当了一种修辞资源,有助于锁定与现代指挥相关的新含义和实践并使之正规化。这些发现对于如何分析军事文化、技术和战争实践之间的关系具有重要意义;因此,这些发现指出了技术和战争的想象如何交织在一起,并对未来冲突如何展开产生了重大影响。

速度与知识

除了人工智能技术和军事指挥实践之外,本文还关注速度与知识这两个主题之间的紧张关系。速度是战争不可或缺的要素,长期以来一直为实践者、理论家和学者所强调。尽管如此,尽管速度作为战争中的一个关键因素经常被阐述,但其部署在不同时期和背景下并不完全一致。军事思想经典都强调与速度有关的要素。例如,《孙子兵法》指出,"虽闻战之愚急,而智不与久耽"。因此,孙子在指出行动过快的风险的同时,也指出了快速而巧妙的行动可能带来的好处。不过,在这里,他也指出了与战争持续时间过长的风险有关的战略计算。其中包括财政成本。不过,孙子也简要提到了指挥官 "迅速 "决策的可能优势,以及 "迅速 "行军到意想不到的地点以达到战术奇袭的目的。尽管如此,他在此也告诫人们不要无节制地追求快速、强行军,因为这会造成组织混乱和供应链问题。从这个意义上说,对孙子来说,速度并不是统一的优势。他建议 "疾如风,密如林",就是对这一观点的总结。看来,对孙子而言,速度和维持军队组织的必要性都不是万能的。

提纲

本文的论述过程如下。第二章评估了以往关于战争与技术关系的文献。它指出了四种可能的替代解释来源,并强调了每种方法如何无法提供适当的工具包来回答本论文的研究问题。在对文献进行回顾之后,第三章提出了一套研究军事实践与技术之间关系的工具,将关系/实用主义社会理论和科技研究的元素与一种方法论相结合,既有谱系研究方法,又有计算文本分析方法。

第四章是 "铺垫 "一章,从历史技术轨迹的角度讨论人工智能。本章旨在为读者提供人工智能的基础知识、该领域的技术历史、当前发展情况,以及在军事和非军事环境中应用人工智能时仍然存在的基本问题。

第五章采用计算文本分析方法,追踪二战后美国军事思想史中的速度与知识主题。它表明,在当今时代,速度的认知要素以及信息和知识在战场上的重要性在军事专业期刊的讨论中处于相对高点。这些趋势为我的论点提供了证据,即在美国国防架构中,新的 "成功 "战争方式正在被构建和讨论。

第六章和第七章为计算结果提供了更多背景资料。依靠对美国国防和军事相关文件的细读,这两章提供了二战后速度(第六章)和知识(第七章)主题的谱系,展示了更广泛的美国军事思想中的特殊变异。这些变异和相对稳定是修辞资源的 "池塘"。然后,每一章都展示了这些修辞资源是如何在有关人工智能的辩论中被部署到指挥决策中的。

第八章的重点是,在美国对人工智能指挥的更广泛理解中,速度和知识的配置是如何紧密联系在一起的。此外,至关重要的是,本章说明了与人工智能和指挥决策相关技术传统冲突所产生的修辞封闭性。相关的技术批判已被战略性地归入更广泛的技术论述和战争表达中,其方式现在与人工智能联系在一起。这种形式的修辞封闭性使人工智能指挥的支持者能够超越反驳论点,从而在美国防部政策中锁定一种特定形式的稳定关系,并日益制度化。最后,第九章就我们如何在人类与人工智能系统紧密结合的当代社会技术配置中构想军事决策提出了一些结论和思考。

成为VIP会员查看完整内容
50

多智能体多团队系统常见于目标分层的环境中。例如,在战区范围内的战斗场景中,从将军到士兵都需要多层次的指挥和控制,以正确执行目标。在游戏环境中也可以看到类似的结构,智能体以团队的形式合作,与其他团队竞争。同一团队中的不同智能体必须在保持各自 “个性 ”的同时,相互配合、相互协调,以实现团队的共同目标。本研究开发了基于策略的多智能体多团队系统,其中策略被设定为团队层面的一种工具,用于以一种有凝聚力的方式协调团队中的多个智能体。本研究提供了战略和基于战略的多智能体多团队系统的正式规范。开发了一个名为 SiMAMT(基于策略的多智能体多团队系统)的框架。介绍了该框架的不同组成部分,包括策略模拟、策略推理、策略评估和策略选择。此外,还开发了一种图匹配近似算法,以支持有效和高效的策略推断。还给出了一些例子和实验结果,以说明所提出的框架,包括其每个复合要素及其整体功效。

这项研究为多智能体多团队系统领域做出了多项贡献:战略和基于战略的系统的规范,以及在真实世界、交互时间场景中实施这些系统的框架;这种复杂而错综复杂的交互的稳健模拟空间;允许在这些系统中在交互时间内进行战略推断的近似算法;验证各种子元素的实验结果,以及显示所提框架功效的全面集成实验。

成为VIP会员查看完整内容
49

随着深度学习和强化学习而来的人工智能新浪潮, 为智能体从感知输入到行动决策输出提供了“端到端”解决方案。多智能体学习是研究智能博弈对抗的前沿课题, 面临着对抗性环境、非平稳对手、不完全信息和不确定行动等诸多难题与挑战。本文从博弈论视角入手, 首先给出了多智能体学习系统组成,进行了多智能体学习概述, 简要介绍了各类多智能体学习研究方法。其次, 围绕多智能体博弈学习框架, 介绍了多智能体博弈基础模型及元博弈模型, 均衡解概念和博弈动力学, 学习目标多样、环境(对手)非平稳、均衡难解且易变等挑战。再次, 全面梳理了多智能体博弈策略学习方法, 离线博弈策略学习方法, 在线博弈策略学习方法。最后,从智能体认知行为建模与协同、通用博弈策略学习方法和分布式博弈策略学习框架共3个方面探讨了多智能体学习的前沿研究方向。 人类社会生活中存在着各种不同形式的对抗、竞争和 合作,其中对抗一直是人类文明发展史发展的最强劲推动 力。正是由于个体与个体、个体与群体、群体与群体之间复 杂的动态博弈对抗演化,才不断促进人类智能升级换代[1]。 人工智能技术的发展呈现出计算、感知和认知3个阶段[2], 大数据、大算力和智能算法为研究认知智能提供了先决条 件。从人工智能技术发展的角度来看,计算智能主要以科 学运算、逻辑处理、统计查询等形式化规则化运算为核心,能存会算会查找。感知智能主要以图像理解、语音识别、机 器翻译为代表,基于深度学习模型,能听会说能看会认。认 知智能主要以理解、推理、思考和决策为代表,强调认知推 理,自主学习能力,能理解会思考决策。博弈智能作为决策 智能的前沿范式,是认知智能的高阶表现形式,其主要以博 弈论为理论支撑,以反事实因果推理、可解释性决策为表现 形式,强调将其他智能体(队友及对手)纳入己方的决策环 进行规则自学习、博弈对抗演化、可解释性策略推荐等。当 前,博弈智能已然成为人工智能领域的前沿方面、通用人工 智能的重要问题。 多智能体系统一般是指由多个独立的智能体组成的分 布式系统,每个智能体均受到独立控制,但需在同一个环境 中与其他智能体交互[3]。Shoham 等人[4]将多智能体系统 定义为包含多个自治实体的系统,这些实体要么有不同的 信息,要么有不同的兴趣,或两者兼有。Muller等人[5]对由 多智能体系统技术驱动的各个领域的152个真实应用进行 了分类总结和分析。多智能体系统是分布式人工智能的一 个重要分支,主要研究智能体之间的交互通信、协调合作、 冲突消解等方面的内容,强调多个智能体之间的紧密群体 合作,而非个体能力的自治和发挥。智能体之间可能存在 对抗、竞争或合作关系,单个智能体可通过信息交互与友方 进行协调配合,一同对抗敌对智能体。由于每个智能体均 能够自主学习,多智能体系统通常表现出涌现性能力。当 前,多智能体系统模型常用于描述共享环境下多个具有感 知、计算、推理和行动能力的自主个体组成的集合,典型应 用包括各类机器博弈、拍卖、在线平台交易、资源分配(路由 包、服务器分配)、机器人足球、无线网络、多方协商、多机器 人灾难救援、自动驾驶和无人集群对抗等。其中,基于机器 博弈(计算机博弈)的人机对抗,作为图灵测试的典型范 式[6],是研究人工智能的果蝇[7]。多智能体系统被广泛用 于解决分布式决策优化问题,其成功的关键是高效的多智 能体学习方法。多智能体学习主要研究由多个自主个体组 成的多智能体系统如何通过学习探索、利用经验提升自身 性能的过程[8]。如何通过博弈策略学习提高多智能体系统 的自主推理与决策能力是人工智能和博弈论领域面临的前 沿挑战。

成为VIP会员查看完整内容
47

人工智能(AI)被视为当今时代最具颠覆性的技术。科学界和商业界正在对它进行大量投资和深入研究。它已在许多小工具和设备(如手机、电脑、网络应用服务器等)中显示出初步的商业用途,如搜索辅助、需求预测、数据分析和验证、建模和模拟、语言学、心理学等。谷歌、微软和亚马逊等商业巨头正在利用人工智能进行消费者行为预测。自 2011 年以来,我们一直生活在被称为 "认知时代 "的时代,因为人工智能正越来越多地融入每个人的日常生活。IBM 的沃森(Watson)可能是首个用于解决各领域问题的人工智能商业应用,于 2013 年推出。2011 年,沃森在 "危险 "游戏中击败了有史以来排名最高的两位选手,从而备受瞩目。此后,沃森得到了进一步改进。

据预测,人工智能将在十年左右的时间内渗透到所有主要民用系统和小工具中,形成其软件基础。此外,据预测,在二三十年内,人工智能将彻底改变世界的运行方式。美国(US)、欧盟(EU)和中国等主要大国、区域已经出台了在各个领域开发、采用和推广人工智能的政策文件和路线图。

不同的专家对人工智能提出了不同的定义。所有这些定义都趋向于机器获得类似人类智能的概念,通常遵循一个被称为感知-认知-行动(或决策)信息处理循环的顺序。人工智能的程序同样遵循这一循环,即人工智能计算机感知周围的世界,通过优化和验证算法处理接收到的信息,并以类似于人类的方式做出行动选择。目前,各种先进的人工智能能力正处于不同的开发和使用阶段,包括自然语言处理、信息搜索、面部、物体或手势识别、自适应学习、直观感知、综合推理、混合智能(人机结合智能)、集体蜂群智能、问题解决、预测和响应等。

人工智能在军事上的应用虽然是人工智能发展的必然产物,具有巨大的潜力和优势,但一直是一个有争议的问题,也是科学界经常产生分歧的话题。随着人工智能的迅猛发展及其进入军事领域,人工智能已经在以一种重要的方式重塑军队的运作。可以预见,它将从根本上改变未来的战争和军事行动。与此同时,由于技术的飞速发展,战争本身也在概念层面发生着变化。未来人工智能将如何塑造战争,专家学者们仍在探讨。

本文旨在根据人工智能的发展轨迹以及围绕其未来军事用途的主要问题,确定人工智能在不久的将来--预计未来十年或二十年--在战争中的扩散情况。本文还为印度寻找了一种衍生工具。本文以 "人工智能系统分类 "一节开篇,带领读者略微深入地了解人工智能,以便客观分析人工智能的发展和应用轨迹。非凡壮举 "部分揭示了该技术的颠覆性。未来的表现 "一节讨论了人工智能未来的发展和普及。这一部分还强调了与人工智能相关的各种问题,同时建立了对人工智能的总体认识。在 "人工智能推动战争 "一节中,试图推导出人工智能将浸渍军事系统并重塑战争,包括概念和条令。然后,本文重点讨论了影响人工智能应用情况的一个主要问题 "不确定性谈判",并从这个角度分析了人工智能在作战空间的应用。下一节分析了与人工智能系统军事应用相关的 "挑战"。关于 "全球领导力竞赛 "的部分强调了人工智能军事应用的全球趋势,随后分析了 "印度的立场",并向印度决策者提出了一些建议。

成为VIP会员查看完整内容
49

机器人和人工智能正在改变我们世界的许多方面。本研究将调查这些技术在水下监视领域的潜在影响和应用,更具体地说,是在应对水雷威胁方面的潜在影响和应用。最终目的是测试是否有可能利用人工智能算法使自主水下航行器具备必要的能力,以取代海上扫雷行动中的人类操作员。这项研究的重要性既在于海事部门日益增长的重要性,也在于机器人和人工智能学科的科学价值。

事实上,海事部门在社会和世界经济中发挥着越来越重要的作用,这就要求加强安全措施,以保证服务的连续性。海上贸易的增长、通过水下管道输送的数据和原材料的数量以及在海岸线附近或海域建造的基础设施的重要性都证明了这一点。然而,必须强调的是,目前监测、控制和必要时干预这种环境的能力非常有限。要监测和保护广阔的海域,需要付出巨大的努力,而这些海域的边界很难界定,也没有关于威胁性质的准确信息,以目前在该领域使用的技术很难持续下去。最近发生的几起破坏其中一些基础设施的事件就证明了这一点,这些事件对整个地区的稳定造成了严重后果(见北溪管道事件)。

机器人技术和人工智能的最新发展也为这一领域开辟了新天地,创造了重要机遇。一方面是所谓的无人海上系统的发展和演变,这种系统能够在恶劣的环境中工作,配备强大的传感器,但平均成本要比传统的海军资产低得多;另一方面是人工智能,它使机器能够在没有人类干预的情况下执行越来越复杂的操作。

本文的研究结构如下。在引言中,概括性地指出了使用海上无人系统(MUS)进行水下监视所面临的主要挑战和机遇,并分析了该领域最有前途的战略和解决方案。

然后,重点转向本论文开发的主要应用,即研究和实现能够自主探测和定位海底地雷的系统和相关算法。

第一步是选择一个符合成本效益和小尺寸要求的合适平台。然后选择一个能够在水下探测水雷等物体的传感器,并将其集成到平台上。

接下来,讨论了人工智能的发展及其在水下领域的应用。重点是研究应用于水下图像的自动目标识别的最新技术。

从最有前途的最新技术入手,开始为自主水下航行器上的准实时应用选择最佳算法。为此,创建了一个水下图像数据集,用于训练和测试基于卷积神经网络的算法。选定用于船上集成的算法是 “只看一次”(YOLO)神经网络。该算法的集成实现了为自动潜航器提供自主探测海底类雷物体能力的目标。此外,该算法的训练和测试阶段强调了正确选择不同数据集的数据以及管理不同水下感知传感器的重要性。然而,这些研究结果凸显了这些算法的一些局限性,这促使人们开始寻找新的解决方案。特别是,我们提出了一种名为 “显著性 CNN ”的算法,它将使用显著性算法检测图像中异常的能力与 CNN 对已知物体进行分类的能力相结合。结果,这种两阶段分类器既能区分感兴趣的物体,也能区分海底的一般异常现象。

最后,结束语一章为今后的工作留出了空间,提出了拟议算法 Saliency-CNN 的新实施方案,并为数字孪生系统在水下机器人技术中的引入和使用铺平了道路。

图 1.1: CSSN 的系统体系示意图。由网关浮标与指挥和控制站连接的异构无人系统,具有各种传感和通信方式(水下和无线电)以及高度自动化。

图 2.2: 基于无人系统的水下监视概念方案。每个无人潜航器都携带一个或多个特定有效载荷并执行特定任务,通过网络进行通信、数据收集和实时监测。水下和空中环境之间的通信基础设施由作为网关浮标的 USV(即配备声学和无线电调制解调器)提供保障。北约研究船 “联盟号”(NRV Alliance)是辅助船,用于开展各种海洋学活动,并可充当 C2S。在草图中,UUV 配备了矢量传感器和/或声学阵列,用于探测入侵者。但有些 UUV 则配备了侧扫声纳有效载荷,用于海底探测。

成为VIP会员查看完整内容
49

鉴于深度强化学习最近在训练智能体赢得《星际争霸》(StarCraft)和《DoTA》(Defense Of The Ancients)等复杂游戏方面产生的影响,利用基于学习的技术进行专业兵棋推演、战场模拟和建模的研究出现了热潮。实时战略游戏和模拟器已成为作战计划和军事研究的宝贵资源。然而,最近的研究表明,这种基于学习的方法极易受到对抗性扰动的影响。在本文中,我们研究了在主动对手控制的环境中为指挥与控制任务训练的智能体的鲁棒性。C2 智能体是在定制的《星际争霸 II》地图上使用最先进的 RL 算法--A3C 和 PPO 训练出来的。我们通过经验证明,使用这些算法训练的智能体极易受到对手注入的噪声的影响,并研究了这些扰动对训练后的智能体性能的影响。我们的工作凸显了开发更稳健的训练算法的迫切性,尤其是在战场等关键领域。

在《星际争霸》[1] 和《DoTA》[2] 等几款涉及复杂规划和决策的战术和即时战略游戏中,深度强化学习(DRL)已被成功用于训练智能体。这些智能体通过自我博弈、模仿学习等技术,熟练地提出了可与经验丰富的人类玩家相媲美的制胜策略(AlphaStar [3]、OpenAI Five [4])。因此,近年来,军事研究界对将这些 RL 技术应用于作战计划和指挥控制(C2)等任务的兴趣与日俱增。与此同时,传统的游戏引擎也被重新利用来促进自动学习(pySC2 [5]、SMAC [6,7]、pyDoTA [8]),并为战场模拟开发了新的游戏引擎 [9-13],从而创造了实际上的数字兵棋推演。这项研究背后的驱动力是改进和增强未来战场上使用的战略,预计未来战场将更加复杂和非常规,可能超出人类指挥官的认知能力。

最近的研究成果[14]表明,通过强化学习技术和合成数据训练的 C2 智能体在赢得模拟兵棋推演方面取得了相当大的成功。这在一定程度上归功于 RL 训练的可扩展性,事实证明,在面对困难或复杂的场景以及只有部分环境信息的情况下,RL 在探索和利用不同策略方面具有巨大优势。然而,这些评估都是在良性环境中进行的,在这种环境中,C2 智能体可用的信息被假定为未被破坏。实际上,这在战场情况下是不太可能的,因为那里的信息可能因为收集方式(来自传感器或其他输入源)而存在固有噪声,或者可能被敌军篡改。在这项工作中,我们将评估这种训练有素的智能体在面对 C2 环境中潜在的对抗性输入时的鲁棒性。

为此,首先使用《星际争霸 II 学习环境》(SCLE [15])来模拟蓝方和红方两支队伍之间的冲突。C2 智能体指挥 "蓝方"消灭 "红方"部队,从而赢得战斗。接下来,假设环境中存在攻击者,在 C2智能体获得从战场收集到的观测数据之前对其进行篡改。添加的扰动被称为对抗性扰动,其构造非常难以察觉,以躲避检测,同时最大限度地颠覆 C2 智能体的策略,使其变成有害的东西(图 1)。然后,我们将从多个指标评估智能体性能的下降,并从军事角度分析行动方案的偏差。

图 1:鲁棒性评估方法: 图中显示了良性环境(上图)和恶意环境(下图)在时间步长 t 上的差异。t - 1 时的观测数据被输入到在良性环境中经过预训练的 C2 智能体。由于输入中注入了敌意扰动(橙色),智能体采样了次优行动,最终导致 BlueForce 损失。

主要贡献总结如下:

  • 通过经验证明了训练有素的 C2 智能体在输入观测数据的微小对抗性扰动面前的脆弱性。我们的研究量化了一些预期趋势,并揭示了一些非显而易见的趋势。例如,我们的研究显示,部分训练有素的智能体似乎比完全训练有素的智能体更能抵抗噪声。

  • 出于通用性考虑,评估了两种不同场景下的攻击效果,这两种场景分别对应 C2 智能体的攻击和防御任务。

  • 还对使用 A3C 和 PPO 这两种最先进的 RL 算法训练的智能体进行了评估,并对它们对注入噪声的鲁棒性进行了评论。

  • 通过分析策略网络预测的行动分布因攻击者的扰动而发生的变化,提供了模型输出的可解释性。

我们的评估结果表明,香草 RL 训练很容易受到敌方扰动的影响,因此需要建立稳健的训练机制,并采用复杂的检测和预防技术,尤其是在这种关键场景下。

本文的结构如下。首先,我们简要介绍了将 RL 用于 C2 的背景,然后在第 2.1 节中描述了星际争霸环境和两个自定义场景--虎爪和 NTC,我们使用这两个场景来训练我们的智能体。在第 4 节中,我们描述了自定义场景的状态和行动空间,以及 RL 智能体的细节。第 4.2 节和第 5 节分别介绍了攻击方法和评估。最后,我们讨论了利用对抗性鲁棒训练技术的必要性和未来工作方向。

图 5:C2 策略网络: C2 智能体的策略网络组合图。输入和输出分别用蓝色和黄色表示。阴影矩形表示连接操作。Conv2D 层和 FC 层被 ReLU 激活。

成为VIP会员查看完整内容
46

本文探讨了无处不在的人工智能对战斗本质的改变。将目光从人工智能取代专家转向人机互补的方法。利用历史和现代实例,展示了由人工智能操作员和人工智能/机器学习代理操作员组成的团队如何有效管理自主武器系统。方法基于互补原则,为管理致命自主系统提供了一种灵活、动态的方法。最后,提出了实现机器加速战斗综合愿景的途径,即由人工智能操作员操作战场人工智能,观察战场内的行为模式,以评估致命自主系统的性能。与任何纯粹的自主人工智能系统相比,这种方法能开发出更符合道德规范、以机器速度运行并能应对更广泛动态战场条件的作战系统。

2022 年 11 月,ChatGPT 的发布标志着人工智能(AI)发展史上的一个关键时刻。几十年来,人工智能一直是人们热衷研究的课题,但对于普通人来说,它仍然是一个抽象的概念,更多的是科幻小说或技术演示,比如 IBM 的沃森赢得了《危险边缘》(Jeopardy)。然而,有了 ChatGPT,人工智能走出了实验室,人们可以用与朋友和同事交流的方式与人工智能对话。ChatGPT 将公众对人工智能的看法从未来的可能性转变为实实在在的现实。与此同时,在距离开发 ChatGPT 的办公室千里之外,乌克兰正在将人工智能融入战场。面对俄罗斯大规模的射频干扰,乌克兰部署了人工智能增强型无人机,能够在敌对条件下,在无人监督的情况下有效运行。人工智能的这一应用并不是要进行对话或模拟类似人类的互动,而是要在传统系统失灵的情况下,增强对大型对手的作战能力。ChatGPT 的认知能力与乌克兰无人机对人工智能的功利性应用之间的对比,说明了人工智能在不同领域的多样性和变革性。

这两项人工智能应用促使美国国防部(Department of Defense,DoD)关于战场人工智能的战略思想发生了潜在转变。最初的人工智能条令强调,对人工智能系统 "适当程度的人为判断 "至关重要,"要有明确的程序来激活和关闭系统功能,并对系统状态提供透明的反馈"[5]。对 "自主和半自主武器系统的人机界面"[5] 的要求意味着一定程度的人类直接互动,通常称为 "人在回路中"(HITL)或 "人在回路中"(HOTL)。这种人类直接参与人工智能或监控错误的方式,证明了对关键流程自动化的谨慎态度。

之所以会出现这种转变,是因为人们认识到,人工智能及其不可避免的技术普及,将不仅仅是补充,而是从根本上改变战场上的行动和情报搜集,就像它已经开始改变社会上几乎所有其他地方一样。这种演变并非首次发生。就在上一代,互联网的出现和智能手机的普及彻底改变了通信和信息获取方式,以至于国防部别无选择,只能适应。与这些创新一样,人工智能也正走在一个类似的基本层面上。现在的挑战不在于试图支配人工智能的整合,而在于适应其不可避免的普遍性,在担心数据偏差、计算 "幻觉 "的情况下确保军事系统的可靠性和有效性,同时确保致命性自主武器系统的行为符合国际人道主义法(IHL)。本文件旨在探讨这些挑战,并提出缓解这些挑战的途径,同时认识到人工智能增强战争的进程不仅不可避免,而且已经开始。

讨论

2022 年,人工智能达到了一个拐点。随着电子战的加剧,乌克兰冲突迫使自主无人机快速发展。与此同时,像 ChatGPT 这样的强大语言模型的发布吸引了全球观众,尽管它们的局限性也变得显而易见。这些系统容易出现事实错误和赤裸裸的捏造,凸显了将模式识别误认为真正理解的风险。在人工智能颠覆整个行业的同时,我们也认识到,人工智能的流畅性往往掩盖了根本无法分辨真假的缺陷。

人工智能在军事上的应用提出了独特而棘手的伦理问题。根据特定数据训练的人工智能系统是实现其设计目的的强大工具。它们擅长模式识别和快速执行所学任务。但人工智能系统适应新情况的能力,尤其是在人命关天的情况下,仍然不太清楚。

虽然人工智能在数据处理和分析方面的能力毋庸置疑,但它在道德框架内指导行为的能力却不那么确定。图 1 展示了战场自主人工智能的典型组织结构。作战人员(橙色圆圈)直接操作一套武器系统(蓝色圆圈),每套系统都通过一个人工智能模型进行调解,该模型经过训练,可控制特定武器与敌人交战。然而,如果敌人已经找到了欺骗人工智能模型的方法,作战人员往往无法改变模型的行为。相反,作战人员必须依靠其他可能风险更大的手段与敌人交战。在战争中强调简化、精简的人工智能模型会带来一种危险的脆性。当人工智能模型被愚弄时,它可能会使作战人员面临更大的风险,同时将关键优势拱手让给敌人。

在本文中,我们提出了 3.8 节中介绍的人工智能操作员或 "马夫 "的角色。这种角色延伸了加里-卡斯帕罗夫(Garry Kasparov)在 "高级国际象棋 "中提出的 "半人马"(centaur)概念,即人类与多个国际象棋程序合作,将人类的战略洞察力与机器的计算能力相融合,以达到超高水平的竞争[21, 13]。这些相互促进或互补的领域已被证明优于任何一个单独的组成部分[23]。互补的概念是将多个元素结合在一起,产生一个比任何一个部分都更有效的整体,这与更常见的替代做法有着本质区别,替代做法是单独使用能力最强的部分--人类、自动化或人工智能。替代系统的实际结果是,它们的强大取决于最薄弱的部分。由作战人员、战场人工智能、远程人类操作员及其本地人工智能代理组成的网络可确保人类和人工智能的优势得到最大程度的发挥(图 2)。半人马概念在军事战略中的演变说明,未来人类与人工智能的合作不仅有益,而且对于在高度动态和竞争激烈的环境中取得优势至关重要。

要想让人工智能系统在军事环境中可靠运行,人类操作员必须了解人工智能的决策过程。这就意味着要对具有不同技能和背景的操作员进行培训。就像棋手调整策略一样,操作员应能根据需要切换人工智能模型。不能指望单一的人工智能模型在每一种战场场景中都能完美发挥作用。情况是不可预测的;在一种情况下最好的模型在另一种情况下可能会失效。操作员必须了解每种人工智能模型的优缺点,以确保使用最有效的工具来完成手头的任务。这种适应性是人工智能成功融入军事行动的关键。

在军事行动中,采用这种灵活的方法将人类与人工智能配对,可创建出比人工智能单独运作的系统更灵活、适应性更强的系统。这种人类与人工智能的共生关系可以破坏对手的 "观察、定位、决策、行动"(OODA)循环[18],有效地 "反客为主"。人工智能在人类直觉和经验的充实下,引入了不可预测性和复杂性,纯人工智能对手可能难以理解或实时处理这些不可预测性和复杂性。这可能会使天平向有利于人类-人工智能团队的方向发生决定性的倾斜,使他们在关键时刻超越和思考纯人工智能系统,从而获得战术优势。

人类可以利用自己的创造力和创新力提出人工智能无法提出的新想法和解决方案。例如,将人类对已知危险和风险的了解融入自主系统,可以让操作员确定并预测基于人工智能的控制器在遇到真实世界的风险因素时的行为[6]。我们还能理解人工智能忽略的细微差别和情境,这对决策至关重要。最后,人类在群体中表现最佳,每个人都能带来不同的视角和技能,从而提供深度理解,而目前的人工智能似乎可以模仿,但却无法复制。

成为VIP会员查看完整内容
49

为响应美国国防部(DoD)的战略现代化倡议,美国空军(USAF)正在努力开发在未来行动中取得成功的技术和战术,而做好准备取决于现在就进行投资。为了进行有效的投资,美国空军和其他国防规划机构都希望了解,当新技术和新概念方案改变军事行动中使用的系统时,军事行动的结果会发生怎样的变化。在这一过程中,军事模拟是一个重要的工具,可以帮助人们建立对替代技术和概念的理解和推理能力。

在早期能力设计中,需要考虑各种新兴技术和创新概念,分析涉及在模拟环境中运行的模拟人和模拟机器的协作和冲突结果。美国空军最近正在考虑的一个场景是空军基地防空 (ABAD),其目标是了解如何在空军基地遭受导弹和无人机袭击的情况下有效运作。为了决定投资,为成功实现空中基地防御做好准备,美国空军正在努力确定有问题的场景和有希望解决问题的替代方案。然而,在所考虑的各种情况和投资中,为应对技术变化和不断发展的威胁而进行现代化所需的速度意味着需要加快基于模拟的分析,以便更快地建立理解并为决策提供依据。

目前的仿真分析是通过部队设计过程,利用不同的作战视角迭代建立对未来作战的理解,从而应对未来预期作战的复杂性。在美国空军,这是在空军作战集成能力(AFWIC)领导的 "评估-发展-评价能力发展规划"(CDP)设计循环中完成的。在这一迭代过程中,有两大部分是有效模拟分析的核心。首先,通过产生重要的、突发的行为来积累知识;其次,通过桌面设计演练,将利益相关者聚集在一起,并允许与基于仿真的数据进行参数化交互,从而实现真实世界的决策。我们为管理突发行为的工作过程制定了一个框架--"在缺乏知识的情况下利用仿真分析管理突发行为的非线性和随机未来行为探索(ENFLAME)",以构建相关活动的结构,并将研究重点放在这项工作上。

突发行为是军事行动结果的关键性变化,通常难以预测,因为复杂性会导致一系列不幸事件,导致出人意料的坏结果,或一系列幸运事件,导致出人意料的好结果。在 ABAD 的例子中,这可能涉及各种技术和概念的组合,即使在导弹和无人机攻击的预期困难情况下,也能产生出人意料的好结果。要找到这些突发行为,通常需要专家与模拟进行交互,并知道应关注和查询哪些领域,或者使用蒙特卡罗模拟(MCS)进行随机搜索。然而,美国空军正在使用的高保真、昂贵的军事仿真却限制了蒙特卡洛仿真的使用,因为要找到罕见的、令人惊讶的行为,需要进行很多很多次仿真。此外,专家资源有限,只擅长某些领域,而且未来军事行动十分复杂,即使是专家也难以预测。这些挑战促使我们需要改进寻找重要突发行为的方法。

本论文的研究工作通过改进 "评估-开发-评估 "设计循环中的两项关键活动,解决了加速仿真分析所面临的挑战。首先,为了加速基于仿真的突发行为分析,我们开发了一种能更快找到突发行为的新方法--使用数值优化(LANTERN)方法追踪极端罕见事件的低成本自适应探索(LANTERN)。LANTERN 基于从文献中归纳出的突发行为的特定定义,可以制定优化方法,以比蛮力 MCS 技术更快的速度搜索突发行为。具体来说,利用新颖的贝叶斯优化(BO)技术加速搜索作为罕见、局部和随机极端事件的突发行为,该技术可自适应地查询仿真响应以查找罕见事件。这些新技术针对的是与突发行为相关的高度局部极值和局部高变异性的独特特征。与军事智能体建模(ABM)的预期响应行为相匹配的测试问题实验表明,与 MCS 相比,该技术有了很大改进。其次,为了在桌面设计演习中加快对随机行为的分析,介绍了一种替代建模方法--ECDF-ROM 方法,该方法采用了从工程设计中借鉴的降序建模(ROM)技术,并结合了一种新的现场表示方法。

研究突发行为的实验表明,使用新的 BO 技术比使用蛮力 MCS 有了显著改进,可以更快地发现罕见的极端事件。针对桌面设计练习的智能体建模实验也显示了近似预测完整经验分布的可行性。利用仿真、集成和建模高级框架(AFSIM)开发的两个基于智能体的军事模拟场景,完成了对 LANTERN 方法和 ECDF-ROM 方法的最后演示。首先,使用敌方防空压制(SEAD)场景来演示 LANTERN 步骤在搜索罕见的局部极端事件方面的有效性。其次,使用四对四空战场景演示 LANTERN 步骤在搜索罕见、随机极端事件方面的有效性,同时演示 ECDF-ROM 智能体建模方法。通过这些演示,本论文中开发的 LANTERN 方法和相关方法(基于泰勒扩展的自适应设计 (TEAD)、针对多外延突发行为的分区贝叶斯优化 (PIONEER)、变异贝叶斯优化 (VarBO))以及 ECDF-ROM 智能体方法可用于加速基于迭代模拟的军事场景分析的关键部分。研究结果还强调了对 ENFLAME 框架的重要更新,该框架旨在利用军事仿真管理突发行为--再次强调利用仿真发现重要突发行为的能力,并使未来的工作重点放在基于新技术和新概念的漏洞识别与缓解以及机会利用上。

图 1.5:描述和模拟军事行动的智能体模拟方法图解。注意重点是独立感知、决策和行动的自主智能体,以及定义动态的一系列交互作用。

管理突发行为的 ENFLAME 框架

图 2.2:管理突发行为的 ENFLAME 框架概述。

图 2.2 是 ENFLAME 框架的示意图。该框架有四个核心部分。首先,具体化情景涉及情景建模,包括行动概念(CONOPS)、参与者(系统、人员等)、情景中系统之间以及系统与环境之间的交互。此外,这还包括与直接用于决策的投资和感兴趣的投资领域之间的联系。主要的建模任务还包括翻译和开发模拟表示法,在模拟表示法中对分辨率和范围进行选择,以满足情景中的决策问题所提出的需求。

其次,一旦创建了情景模拟表示法,就需要探索如何发现重要的突发行为,以便对系统行为进行管理(从输入和情景配置以及结果的角度找出系统的弱点和机会所在)。根据上述将突发行为定义为罕见的极端事件,要找到这些事件发生时的位置,就需要一种寻找突发行为的方法。这与分析中的 "评估 "阶段关系最为密切。

第三,当发现突发行为时,就需要解决其极端性所带来的问题漏洞或潜在机会。这就需要探索情景中各系统相互作用的因果动态,这些动态导致了极端事件的发生,并产生替代规则或变化,以减轻有问题的行为或强化良好的行为。这与分析中的 "发展 "阶段关系最为密切。

最后,一旦设计出潜在的替代方案,使系统中的行为保持在可接受或有利的状态,就需要评估这些替代方案的可行性和可负担性,并将其与潜在的投资方案联系起来。这与分析中的 "评估 "阶段关系最为密切。

成为VIP会员查看完整内容
44

随着大国为战略竞争做准备,战场效率将取决于是否有能力超越其步调威胁的决策周期。美军一直在发展多域作战新概念,旨在更好地整合空中、陆地、海上、太空、网络空间和电磁频谱等领域的作战行动。如今,美军已经开展了多域作战行动,但当前的举措旨在扩大此类行动的范围、规模和速度,从而实现所谓的 “融合”

融合意味着从传感器收集数据、分析数据、辨别重要信息、将其发送给相关操作人员,并在正确的时间、从正确的平台使用正确的弹药做出最佳反应。要实现融合,就需要一支对共同作战环境有共同认识、日益一体化和可互操作的部队。根据美国国防部的设想,通过联合全域指挥与控制概念,联合杀伤网可以快速有效地将任何传感器与任何射手联系起来,这就是融合原则。换句话说:

  • 美陆军拥有武器、观察、定向、决策、行动(OODA)环路以及解决陆基问题的杀伤链。美海军拥有武器、OODA 循环和杀伤链,可解决海上问题。美空军拥有武器、OODA 循环和杀伤链,以解决空中问题。此外,太空、网络空间和电子战也有自己的武器、OODA 循环和杀伤链。需要在所有指挥层级用六维杀伤网(将所有六个战争领域连接成一个动态网络)取代这些二维杀伤链(静态的线性事件序列)。

概念化,更重要的是--理解--扩展的作战空间,在这一作战空间中,一体化和分布式部队为推进安全信息准化(即正确的信息在正确的时间和地点传递给正确的人),将需要网络、波形、连通性、分布式指挥和控制以及一体化平台--其中许多平台都是自动化的,以机器的速度进行决策和行动。在这种情况下,要对整个作战空间的无数决策进行真实、透明的监控,可能需要类似于金融部门的动态和新兴环境的自动化监督。

然而,能力的融合意味着机器和传感器不再是军队的战术附属品。它们越来越多地被当作战术决策辅助工具来依赖,甚至被推崇。随着通过在多个领域将杀伤链编织成杀伤网来增加作战空间的复杂性,并在所有指挥层级用机器来增强人类的任务,人类和机器都将在迭代过程中相互影响。

因此,将出现一种混合现象人类和机器的任务将如此紧密地交织在一起,以至于它们共同表现出全新的新兴行为,这些行为可能会模糊机器行为的终点和人类行为的起点。这将导致人类和机器之间的迭代互动,从而形成混合组织系统,表现出自身的行为并产生自身的效果。更具体地说,随着这些新技术与其他现有技术的整合以及密度的增加,可能很难甚至不可能区分哪些输入和决策是人类的,哪些是机器的,以及它们是如何做出决策、评估或预测的。在这种交互式的复杂性下,往往无法分离出单个原因及其影响,因为各部分都连接在一个复杂的网络中。这些现象都是突发系统的表现。(更复杂的是,由于网络内资产的参与密度和可能同时发生的实时审批请求,杀伤网络比传统的支持/被支持关系更加复杂。由此产生的是一种复杂的群体动态,这种动态无法从针对个人的规则中推测出来。突发系统的整体行为与其各部分的行为有着本质区别,而在分离各部分的过程中,它们会失去一致性、意义和背景。确定机器的能动性在哪里结束,人类的能动性在哪里开始,就成了一个问题。

此外,法律上的因果关系测试在应用于突发系统时往往会出现问题。在确定可预见性、因果关系以及最终人类可能的想法或意图时,法律分析依赖于人类行为和代理的证据。随着机器自主性对人类能动性的干预,包括重新分配能动性和重新安排能动性,它混淆了我们长期以来赖以赋予法律和道德责任以及追究人们和机构责任的规范。当我们把杀伤链编织成杀伤网时,我们同时也在增加人类和机器与单个领域子系统之间互动的复杂性,然后,这些无数的互动将被整合到各个指挥层级的多个领域中。如果我们将单一的线性路径--法律因果关系链与动态、模块化和非线性的杀伤网络对立起来,会发生什么情况?一个由进攻和防御战术组成的复杂自适应系统作为一个杀伤网络运作,可能会使其中的人类机构的可追溯性几乎无法识别。

建议

为了充分理解自动化增强的影响,组织领导者可以采用一种关系本体论,即在数字时代,人类和智能体在混合集体中紧密交织,它们之间的关系决定了它们的行动区块链技术(BCT)可能是一种新的风险管理范式,它更加积极主动、互联互通,能够识别各种关系和无形风险,提供多层次的缓解措施。BCT 已被认为是减轻银行业信贷决策不确定性的一种手段;是动态风险管理的网络威胁情报共享系统的一种手段;也是在加强利益相关者之间联系的同时防止安全漏洞的一种手段。通过促进早期阶段的风险识别,以及在指挥官实施风险缓解措施后定期审查这些风险,生物恐怖主义技术可帮助预防和消除在机器与人类反复互动的多变、不确定、复杂和模糊的混合环境中,预期会对作战流程(如目标锁定周期)产生的负面影响。换句话说,BCT 可以帮助指挥官了解,虽然存在一个责任区,但该责任区内的不同领域(包括地理和功能领域)可能在战术和作战上具有不同的 “人+机 ”关系。了解这些关系可提高指挥官对信息融合所需的信息准度的认识,同样,也可将目标匹配给杀伤网中在时间和空间上处于最佳状态的平台,以便对其进行反击。

参考来源:美国海军陆战队

成为VIP会员查看完整内容
47

在本论文中,我们研究了机器学习算法的在分布内泛化,着重于建立泛化误差的严格上界。我们脱离传统的基于复杂性的方法,通过引入和分析信息论上界来量化学习算法与训练数据之间的依赖性。我们考虑了两类泛化保证:

  • 期望中的保证。这些界限衡量平均情况下的性能。在这里,算法与数据之间的依赖性通常通过互信息或基于f-散度的其他信息度量来捕捉。虽然这些度量提供了直观的解释,但它们可能忽略了算法假设类的几何特性。为了解决这一限制,我们引入了使用Wasserstein距离的界限,该距离在数学上更为复杂,但考虑到了几何因素。此外,我们提出了一种结构化、系统化的方法来推导捕捉算法与单个数据点之间以及算法与训练数据子集之间的依赖性的界限,条件是已知其他数据。这些类型的界限提供了更深入的洞察,我们通过将其应用于推导随机梯度Langevin动力学算法的泛化误差界限来证明这一点。
  • PAC-Bayesian保证。这些界限衡量高概率下的性能水平。在这里,算法与数据之间的依赖性通常通过相对熵来衡量。我们建立了Seeger–Langford界限和Catoni界限之间的联系,揭示了前者通过Gibbs后验进行优化。此外,我们为各种类型的损失函数引入了新的、更紧的界限,包括那些具有有界范围、累积生成函数、矩或方差的损失函数。为此,我们引入了一种新的技术来优化概率陈述中的参数。我们还研究了这些方法的局限性。我们提出了一个反例,其中大多数现有的(基于相对熵的)信息论界限失败,而传统方法则不会。最后,我们探讨了隐私与泛化之间的关系。我们表明,具有有界最大泄露的算法可以泛化。此外,对于离散数据,我们为差分隐私算法导出了新的界限,这些界限随着样本数量的增加而消失,从而保证了它们即使在隐私参数保持不变的情况下也能泛化。这与文献中要求隐私参数随样本数量减少以确保泛化的先前界限形成对比。

当前,机器学习在默默地塑造着我们周围的世界:从我们在社交媒体上看到的定制内容,到医疗、金融或自动驾驶等高风险行业【16-19】。机器学习算法被用来分析数据,用于早期疾病检测、防止欺诈或控制自动驾驶汽车的转向、制动和加速。因此,对于何时以及为什么这些算法在关键情况下能够适当地表现,拥有一个坚实的理论理解是至关重要的。 机器学习算法(或简称为学习算法)是一种机制,它观察问题实例的序列(通常被称为训练集)并返回针对该问题的假设。例如,给定一个包含两个生物标记和一个标签(标明一个人是否患有某种疾病)的医疗记录训练集,学习算法会返回一个模型,该模型从医疗记录中预测该疾病的存在。在这种情况下,假设是医疗记录与疾病存在之间的映射,这种映射由预测模型表征,如图1.1所示。算法返回的假设在训练集上可能表现得非常好。然而,这并不一定意味着它在新的、未见过的数据上也会表现良好。例如,考虑图1.1中的复杂假设,尽管它可以完美地解释医疗标记与疾病存在之间的关系,对于训练数据中的所有实例都是如此,但当它用来描述同一分布下的未见数据时就会失败。泛化理论领域专注于寻找数学保证,保证学习算法返回的假设在新的、未见过的数据上的性能。我们通常通过损失函数来描述算法的性能。在上述例子中,如果算法正确判断出一个人从其医疗记录中是否患病,则损失函数返回0,否则返回1。因此,损失函数的较小值意味着更好的性能。上述的泛化保证通常是对问题分布样本上损失函数期望值的上界形式,也称为人群风险。或者,保证以泛化误差的上界形式出现,泛化误差定义为人群风险与训练集实例上平均损失函数之差,或称为经验风险。在研究学习算法的泛化时,我们可能会考虑新数据来自相同分布(在分布内泛化)或接近但不同的分布(在分布外泛化)。例如,同一医院按照相同协议收集的同一人群统计的医疗记录可以被认为是来自同一分布。然而,来自不同人群统计的医疗记录通常被认为是来自不同的分布。例如,居住在高海拔城市的人的血氧水平低于居住在海平面的人。这种分布的变化通常被称为分布偏移。在本论文中,以及接下来的文本中,我们将仅关注在分布内泛化。泛化保证有两种主要类型: * 期望中的保证。这些保证是两者中较不具体的。它们确保算法返回的假设的平均性能永远不会小于某个量。 * 高概率保证。这些保证确保,以高概率,算法返回的假设的性能永远不会小于某个量。在信息论泛化的背景下,这种保证被称为PAC-Bayesian保证。研究学习算法泛化的经典方法侧重于算法考虑的假设类的复杂性。这指的是算法可以选择的可能假设的丰富性。这些方法背后的思想是,来自更复杂类的假设可以很好地适应训练集,但它们可能过度拟合,即它们可能适应它们观察到的特定数据的采样噪声,这可能与未来的实例不同。另一方面,来自更简单类的假设不能适应采样噪声,并需要关注数据中的高信号模式,代表数据分布。更简单类的缺点是它们缺乏丰富性,可能意味着它们的假设无法很好地描述训练集中的模式。然而,它们仍然具有小的泛化误差,它们在训练集中的表现不佳预示着在新的、未见过的数据上的表现也不佳。请参见图1.1,了解这种二分法的示例。像基于均匀收敛或Rademacher复杂性的经典方法的一个重要特征是,它们为算法考虑的整个假设类提供泛化保证。这可能太限制性了,因为在一个复杂的假设类中,仍可能有假设能够很好地泛化。脱离这种限制的一种方法是算法稳定性框架,它为稳定的算法提供泛化保证,即在呈现类似训练集时返回相似假设的算法。通过这种方式,算法稳定性可以保证考虑复杂假设的算法的泛化,只要它们在类似的训练集上一致地返回这些假设。通常,“类似训练集”的概念只考虑观察到的数据的每个可能值,无论多不可能,使得框架对某些情况过于限制性。最后,信息论泛化框架提供了针对算法和数据分布特定的保证。其思想是使用信息度量来捕捉算法返回的假设与训练集之间的依赖性。直观地说,假设对它看到的特定实例的依赖越多,它就越过度拟合,泛化性就越差。这种个性化的方法虽然更细致,但在之前的方法失败的情况下允许更强的理论结果。信息论泛化框架阐明了隐私和泛化之间的联系。如果算法返回的假设不泄露或不依赖于用于训练的实例的太多信息,那么算法是私密的。因此,算法越私密,算法返回的假设与训练集之间的依赖性就越小,它的泛化性就越好。

成为VIP会员查看完整内容
45

📈 政务领域:大模型技术正逐步应用于提升政务服务的数字化与智能化水平,尽管目前多用于内部辅助,但未来有望向公众提供更精准的服务。 🚀 金融领域:金融机构积极采用大模型以提高工作效率和决策质量,尤其在保险售前、智能投研等方面展现出巨大潜力。 🏆 产业升级:大模型技术在产业升级中的应用具有强大的辐射效应,能够推动全产业链的数字化转型。 🌐 医疗领域:医疗大模型面临数据治理和隐私保护的挑战,但其在辅助诊断和科研教学中的潜力正逐渐被挖掘。 🤖 文化教育:文娱产业对大模型的应用展现出快速发展趋势,同时教育领域也在探索大模型辅助教学的可能性。 📚 智慧城市:大模型技术在智慧城市建设中扮演着关键角色,尤其在交通管理、环境监测等方面展现出其强大的数据处理能力。

成为VIP会员查看完整内容
40
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员