2022 年 11 月,OpenAI 发布了一款聊天机器人 ChatGPT,它由一个名为生成预训练转换器(GPT)的大型语言模型(LLM)驱动。令人惊讶的是,ChatGPT 在两个月内就获得了 1 亿用户。相比之下,YouTube、Instagram 和 Facebook 分别用了 1.5 年、2.5 年和 4.5 年才达到同样的里程碑。

语言模型并不新鲜。约瑟夫-韦曾鲍姆(Joseph Weizenbaum)在 20 世纪 60 年代就开发了一个这样的模型 Eliza。该模型使用简单的模式匹配和替换技术来模拟与人类治疗师的对话[Weizenbaum 1976]。此后,人工智能研究人员开发了基于规则、统计和神经的自然语言理解和生成方法。

最近,LLM 改变了科学前沿。GPT 就是一个例子。这些模型使用一种称为深度神经网络(DNN)的极具表现力的架构来学习单词在不同句子和段落上下文中出现的可能性。LLM 是在庞大的数据存储基础上训练出来的,在互联网中占有相当大的比例。这为 LLM 提供了广博的知识。事实上,LLM 是基础模型的一个特殊例子--人工智能中的通用模型,是训练成为某一领域专家的更专业模型的基础。

尽管语言模型在过去 50 多年中取得了重大技术进步,但 ChatGPT 的发布仍是一个转折点: 这是语言模型第一次得到广泛应用。ChatGPT 之所以能做到这一点,部分原因是它的反应相对于早期的语言模型更加准确,而且 LLM 具有新出现的能力。具体来说,LLMs 能够进行无语境学习,即根据用户指令调整自己的回复方式。这种能力使 LLM 能够完成它们没有经过训练的新任务。

LLM 的技术能力令人印象深刻。但它们是否会对现有流程产生实质性影响,是否会导致新流程的产生?简而言之,LLM 的实际用途是什么?

为了回答这个问题,我们进行了四项深入的案例研究。在每个案例研究中,我们使用 ChatGPT 网络应用程序中提供的 GPT-3.5 版本,根据我们提供的提示完成任务。本文中描述的案例研究跨越多个领域,需要的能力也大不相同:

  • 数据科学
  • 培训与教育
  • 研究
  • 战略规划

对于每一个案例,我们都会展示我们与 ChatGPT 交互过程中产生的未经修改的文字记录。然后,我们对与 ChatGPT 的互动模式进行评论,并指出其在具体案例研究中的优势和局限性。

我们发现,ChatGPT 有助于提高所生成产品的质量并加快其开发。然而,ChatGPT 并没有消除人类参与的需要:需要知识渊博的人将复杂的任务分解成 ChatGPT 可以完成的简单任务,他们还需要验证 ChatGPT 的输出结果。我们报告的更多细微的发现都与 ChatGPT 有关--它们可能不适用于其他现有的或正在开发的 LLM。然而,ChatGPT 可以提高工作效率,但不能取代人工参与这一发现对所有 LLM 都适用。

案例:战略规划

长期思考和规划对于个人和组织的成功至关重要。商业战略家彼得-施瓦茨(Peter Schwartz)在其颇具影响力的著作《长远规划的艺术》(The Art of the Long View)中,通过一种名为场景规划的技术,强调了面向未来的分析和规划的重要性[Schwartz 1991]。这种方法使组织能够为多种未来场景做好准备,并对新出现的风险和机遇做出反应。

尽管战略规划有诸多益处,但组织在试图驾驭未来的不确定性时也会面临一些挑战。不确定性的两个主要来源是技术发展的速度和不断变化的全球环境。如果不能应对这些不确定性,就可能导致对不成熟或无效技术的投资,从而限制组织应对未来挑战的能力。

学术界、工业界和政府都采用了一套被称为前瞻方法的技术,以便在面对不确定性时做出战略决策[Popper,2008 年]。展望钻石 "是一个根据展望方法所依赖的知识类型对其进行分类的框架(图 4)。钻石的四个象限分别代表基于证据的方法、基于专业知识的方法、创造性方法和互动方法[Popper,2008 年]。

图 4:前瞻性“钻石”

基于证据的方法依赖于对现有数据源(如专利和出版物)的定量分析,以及利用建模和模拟生成新数据。另一方面,基于专业知识的方法依赖于在相关领域拥有特定资质的个人的知识和技能。创造性方法依赖于富有想象力和独创性的思维,而互动性方法则依赖于交流和评估对特定挑战或问题持有部分重叠但截然不同观点的个人的想法。展望方法是战略规划和决策制定的宝贵工具,但也有一些重要的局限性需要考虑。与前瞻相关的一些最大挑战包括以下方面:

1.不确定性: 展望方法允许考虑潜在的未来事件和趋势,但无法消除不确定性。意料之外的干扰会使分析变得过时和不完整。

2.假设: 展望方法基于对未来的假设,而这些假设可能会受到人类偏见、过去经验和当前趋势的影响,可能无法准确反映未来的现实。

3.专业知识: 展望方法依赖于人的输入,因此容易出现错误,如误读数据、分析有误或专业知识不足。

4.成本: 前瞻性方法的实施可能耗时费钱,需要在数据收集、分析和专家咨询方面投入大量资金。

这些局限性会影响展望方法所产生结果的及时性和质量,并可能限制其在拥有充足资源和专业知识的组织中使用。

利用 LLM 增强预测能力

LLM 有可能提高人类智能,并减轻与前瞻性方法相关的一些挑战。因此,它们可以帮助进行战略规划和决策。

表 4 列出了展望方法面临的主要挑战,以及 LLMs 如何应对这些挑战。标有 "中 "字的橙色单元格表示中度赞同使用 LLM 应对该挑战,标有 "高 "字的绿色单元格表示高度赞同。

例如,LLMs 无法为未来事件提供精确的概率值,但它们可以生成替代未来,包括人类可能未曾考虑过的未来。此外,LLMs 还能对小组和高级决策者的意见提出质疑,而不会屈服于群体思维。此外,虽然不能替代人类专家,但在展望活动中,法律硕士可以帮助填补知识空白和验证事实。最后,LLM 有可能使人类以更高效的方式应用创造性的循证技术。

成为VIP会员查看完整内容
2

本论文研究如何将无人水面航行器整合到分布式海上作战的战斗序列中。目的是设计一种成本效益高、作战效率高的无人系统,能够在 2030-2035 年期间为 DMO 概念做出贡献。本论文确定了在常规航母打击群、远征打击群和/或水面行动群中既具有作战影响力又具有成本效益的 USV 任务集和组合,以及无人系统是否有可能取代或补充当前有人系统的一些任务集。主要发现是,在以下两个任务领域,无人潜航器可以极大地补充有人资产:(1)情报、监视和侦察任务集,以及(2)反导弹防御任务集。次要发现是,要达到本论文中描述的效果衡量标准,必须投资 5 亿美元建造约 10 个 USV 平台,并执行上述任务集。作者对美国海军的建议是采用标准化的 USV 设计,重点关注 AMD 和 ISR 任务包。其次,投资约 5 亿美元建造 10 艘这样的平台,并将其集成到目前的 CSG、ESG 或 SAG 之一,这将是过渡到在未来舰队中实施 USV 的垫脚石。

论文总结

本论文通过开发系统架构和相关离散事件模拟,研究如何将无人水面航行器(USV)融入分布式海上作战(DMO)概念。目的是研究 DMO 概念中无人水面兵力的潜在任务领域,然后构建标准化 USV 的功能和物理架构。作者采用了与濒海战斗舰(LCS)类似的概念,为已确定的任务领域提供可安装在标准化 USV 上的外部任务模块包。结构定义完成后,使用离散事件仿真软件开发了一个模型。该模型的场景被定义为在 2030-2035 年期间与近邻对手的舰队对舰队交战。在整个模拟过程中,使用了有效性衡量标准来分析拟议 USV 提供的作战影响。在完成模型分析后,作者最后分析了拟议 USV 平台的成本与其对舰队对舰队交战结果的总体作战影响。

A. DMO 和 USV 概述

2017 年,海军作战发展司令部创造了 "分布式海上作战 "一词,该词源自 ADM Rowden(2017 年)的 "分布式致命性"(DL)。DMO 更多地以全方位的舰队为中心的战斗力来看待分布式兵力,而不是 DL 定义中描述的小兵力组合。DMO 概念的最高目标是让指挥官有更多的选择或传感器/平台/武器组合,并有足够的时间超越对手。DMO 考虑到了资源、信息和技术与组织各级关键决策者的融合。当美国海军将一个系统视为一个分布式网络时,这就很好地概括了 DMO 的概念。分布式网络具有跨所有作战领域的所有可用平台的集成能力,将增强美国海军的进攻和防御能力。本论文的重点是设计和采购这种分布式网络中的无人水面飞行器,这不仅将为载人资产提供一种具有成本效益的替代方案,而且由于人工干预有限,还将提供一种更低的风险管理场景。

无人系统有可能成为美国海军未来兵力结构中的关键兵力倍增器。海军作战部长理查德森(ADM Richardson,2016 年)在其海军战略愿景中列出了四条关键的 "努力方向"。其中一条是 "加强海上海军力量",鼓励探索 "替代舰队设计,包括动能和非动能有效载荷以及有人和无人系统"(6)。本论文介绍了无人水面运载工具的基本原理,包括目前可用的等级、类别和任务类型。论文还论述了无人水面飞行器在未来舰队兵力建设中对 DMO 概念的潜在贡献,以及对无人水面飞行器未来研发至关重要的关键使能技术。

为撰写本论文,通过建模和仿真分析了三种可供选择的 USV 及其三种适用的任务包。所选择的调查平台是 USV ISR 任务平台、USV 水面战任务平台和 USV 反导弹防御任务平台,因为它们被认为与 DMO 最为相关。作者指出,按照本论文的规定,这三种备选方案在当前市场上并不容易获得,但提出功能和物理架构的目的是使未来工作的发展具有可行性,并符合美国海军有关无人系统的愿景和目标。

表 1 总结了作者利用建模和仿真分析的三种备选 USV,并注释了其适用的级别类型和有效载荷。

B. 模型定义

为便于分析备选 USV,作者开发了一个模拟模型。为确保在现实场景和作战环境中分析 DMO 概念,重点放在了南海沿岸冲突上。该模型分为四个主要阶段:威胁产生阶段、发现阶段、目标定位阶段和交战阶段。模型中采用了表 1 所示的三种备选 USV。USV AMD 分成两个独特的平台: 这些配置分别用于防御空中平台和来袭导弹。所有可供选择的 USV 都为友军战斗序列带来了额外的反制措施,包括箔条、主动和被动诱饵、照明弹以及红外和可视烟雾。如表 1 所示,携带导弹的 USV 还携带了特定的有效载荷,为友军的分布式资源库提供了额外的军械。USV ISR 具有其他 USV 备选方案所不具备的能力。该平台的能力是在对方目标定位和交战阶段增加的,使每一枚潜在的友军导弹都能在更大范围内击中来袭的对方平台或导弹。

C. 作战效能分析

数据分析显示,就多种不同的效能衡量标准(MOEs)而言,一些概念化 USV 不仅在统计上有意义,而且在作战上也有意义。在分析 USV 如何为 DMO 概念做出贡献时,有三项效果衡量指标值得关注,它们是 (1) MOE #2:幸存的兵力;(2) MOE #4:10 海里内对方导弹的百分比;(3) MOE #6:防御措施成功率(注意,编号惯例与论文全文一致)。在整个分析过程中,对作战影响最大的备选 USV 是 USV ISR 平台、USV AMD AIR 平台和 USV AMD MISSILE 平台,而 USV SUW 平台被证明对作战没有影响。分析结果并无定论:在 DMO 概念的范围内,无人水面航行器在两个主要任务集中补充有人海军资产最为有效:(1) 情报、监视和侦察任务集,以及 (2) 反导弹防御任务集(防空和反导弹防御)。这就为 USV 的实施设想了更多的防御态势方法,即在纵深防御分层战略中反击对方平台或导弹。

D. 成本分析

为了加强作战效能分析,作者选择使用参数方法来推导成本模型,预测本论文中描述的备选 USV 的成本。作者确定了 40 个具有历史采购成本的平台,并研究了它们的设计规格,以便采用参数方法。生成了等值线图,以便于对多种投资场景下的运行效果和成本进行权衡分析。分析表明,至少需要投资 5 亿美元,才能购置约 10 艘有能力的 USV,从而实现显著的作战效能。追加投资 1.000 亿美元(总计 1.5 亿美元)后,USV 总数有可能增加到 35 艘,与基线投资场景相比,友军 10 海里范围内对方导弹的比例提高了 31.2%(MOE #4),成功反制的比例提高了 9.9%(MOE #6)。

E. 结论

与美国海军 CSG、ESG 和 SAG 的常规兵力结构相比,将 USV 纳入 DMO 提供了一种既经济又有效的作战命令。事实证明,情报、监视和侦察任务以及反导弹防御任务在本摘要 C 部分所注释的规定有效性措施方面具有最大的统计意义和作战影响。以下要点解释了 USV 在作战影响方面最值得关注的三项指标:

  • MOE2:对方兵力存活率。USV ISR 平台的存在与否对这一 MOE 有重大影响。如果 USV ISR 平台存在,预计对方兵力存活率最多可降低约 5.9%。

  • MOE 4:10 NM 范围内对方导弹的百分比。模型中 USV AMD MISSILE 和 USV AMD AIR 平台的数量对该 MOE 有很大影响。如果 USV AMD 平台的组成正确,预计到达 10 海里的对方导弹数量最多可减少约 8.5%。

  • MOE6:防御措施成功。模型中 USV AMD MISSILE 和 USV AMD AIR 平台的数量对该 MOE 有重大影响。如果 USV AMD 平台的构成正确,预计防御措施成功率最多可提高约 4%。

就本摘要 D 部分所述的成本效益而言,值得投资的 USV 只有 USV ISR、USV AMD AIR 和 USV AMD MISSILE 平台。对于具体的作战概念和固定的战斗序列,笔者认为,在战斗序列中实施 USV 的特定组合是一种具有成本效益的方法,可实现所需的有效性措施。

成为VIP会员查看完整内容
1

无人机(UAVs)在军事领域的应用已经非常成熟,在现代战争中具有巨大优势。使用无人机蜂群的概念已经讨论了二十多年,但现在以色列国防兵力首次使用了真正意义上的无人机蜂群系统。无人机蜂群没有确切的定义,但有人提出它应满足以下三个要求。蜂群的人为控制应该是有限的,蜂群中的代理数量至少应该是三个,其合作执行共同的任务。控制多架自主无人机的复杂性带来了如何利用作战员的认知和战术能力来控制蜂群以有效执行军事侦察任务的问题。使用行为树作为控制结构的方法源自之前在蜂群系统方面的研究。行为树是一种组织自主系统行动并对其进行优先排序的结构化方法。行为树类似于有限状态机(FSM),具有模块化、反应灵敏、可读性强等优点。在游戏引擎 Unity 中创建并模拟了三种不同的行为树,其复杂程度不断增加。我们还创建了第四棵更为真实的行为树,并以此为基础讨论了使用行为树与之前工作的优缺点。使用行为树作为创建蜂群的统一结构,将操作员的战术能力与自主蜂群的力量整合在一起,似乎大有可为。我建议将所提出的使用行为树的方法用作讨论蜂群所需的功能的平台,并为作战员和工程师创建蜂群应如何运作的共同愿景。

图 A.2. 用于逻辑模拟的第三行为树和预期目标的图形表示。

引言

无人驾驶飞行器的热度空前高涨。历史上,这些飞行器只能用于军事领域,如今,它们在公共领域有了新的用途。随着技术的不断成熟和普及,无人机的应用范围也在不断扩大。"蜂群 "和 "蜂群机器人 "的概念并不新鲜,但直到现在,支持这一概念的技术还没有出现。关于什么是机器人蜂群,目前还没有确切的定义,但 R. Arnold 等人[1]提出,机器人蜂群需要满足三个要求。一个蜂群应受到有限的人为控制,蜂群中的机器人数量至少应为三个,蜂群中的机器人应合作执行共同的任务。

支持无人机群的硬件已经具备,但如何控制无人机群还有许多问题有待解决。本硕士论文旨在研究如何利用操作员的认知和战术能力来控制蜂群,从而有效地执行军事侦察任务。这项工作着眼于如何将人类操作员与自主蜂群整合在一起,以及如何对如何做到这一点进行高层次的描述。

使用所谓的行为树来控制蜂群的方法是一种有趣的方法,我们对此进行了研究,并创建了三个模拟来进行测试。此外,还对照以前的工作对行为树方法进行了评估,以突出其优缺点。此外,还就如何在创建蜂群控制器时使用行为树提出了建议。

本论文的第一章包括引言,介绍了该领域的前人工作,并进一步描述了问题。第二章和第三章介绍了行为树和执行侦察任务背后的理论。第四章研究了使用行为树控制无人机群的方法。第五章总结了这项工作,并介绍了可能有意义的未来工作。

成为VIP会员查看完整内容
1

联合全域指挥与控制(JADC2)的核心目标是向情报系统共享实时、明确的现场数据。这些系统使用这些实时数据,并将衍生的态势感知、可能采取的行动和应对措施反馈给指挥与控制 (C2) 团队,并在可能的情况下反馈给效应器,以便立即做出反应。在实现这一能力的过程中,以数据为中心是 JADC2 最大的架构优势。

美国国防部对数据中心化的要求

进入JADC2 企业的实时数据流以及由此产生的行动/决策与 2020 年 9 月 30 日公布的美国国防部(DoD)数据战略完全一致。该战略指示国防部领导人将国防部的所有资产演变为以数据为中心的资产,将数据视为武器系统,并将国防部定位为以数据为中心的组织,利用数据的速度和规模来获得作战优势和提高效率。这种以数据为中心的战略要求所有领域的传感器和平台在设计、采购和部署时都以开放数据标准为门槛。现代战场将通过整合不同数据源之间的联系,以及通过使用分析工具实现卓越的态势感知来推动决策优势,这将有助于信息的协调,从而巩固分类精确效果。

国防部文件概述了这一以数据为中心的战略的七个目标--使数据可见、可访问、可理解、可链接、可信、可互操作和安全(VAULTIS)。以数据为中心指的是一种系统架构,在这种架构中,数据是主要的永久资产,而应用程序、任务和作战资产则来来去去。软件组件不交换信息,而是通过共享数据对象在网络上进行通信。应用程序直接读写这些对象的值,这些值缓存在每个参与者中,而不是通过代理或系统中其他潜在的单点故障。

要从以数据为中心的架构网络中获得回报,架构师需要:

  • 建立元数据标记标准;
  • 采用和使用标准化数据接口;
  • 实施通用的数据可用性和访问实践;
  • 采用数据安全最佳实践;
  • 建立符合 JADC2 的信息技术 (IT) 标准;
  • 在整个企业应用 VAULTIS 目标;以及
  • 按相关梯队收集数据。

为了实现数据的快速收集、融合和整理,必须从数据共享的最初阶段就考虑有效数据集成的要求,并在整个作战领域应用单个数据主题的安全性,使所有 JADC2 参与者都能轻松共享数据。

什么是数据中心化系统?

已经确定美国国防部指令要求以数据为中心,但如何创建以数据为中心的系统呢?以数据为中心可以通过以下三个特性来定义:

  • 接口就是数据。接口没有人为的包装或中介,如消息、对象、文件或访问模式。
  • 基础设施能明确理解数据。这就实现了过滤/搜索、工具和选择性。它使应用程序与数据脱钩,从而消除了应用程序的大部分复杂性。
  • 系统管理数据,并对应用程序如何交换数据制定规则。

在以数据为中心的系统中,设计工作从数据模型开始,该模型描述了系统/应用程序所需的数据及其表示方法。不同的系统组件可以访问共享数据,并通过共享数据进行通信。可以制定访问规则,只有经过认证的用户才能访问数据。由于数据方案是事先定义好的,而且所有应用程序都使用相同的数据,因此新组件的集成度极低,而且在大多数情况下,不需要进行数据转换。这种方法的另一个优点是,应用程序之间没有依赖性或耦合性,因为应用程序之间不直接通信。所有通信都是通过访问(读取或写入)数据完成的。

DDS:实时发布-订阅连接框架

对于实时系统来说,通过向中央数据库写入和读取数据来交换数据是不现实的。除了延迟外,数据库服务器还会成为单点故障。为了促进实时系统中的移动数据、点对点通信,由对象管理集团Ⓡ(OMGⓇ)管理的开放数据分发服务(DDSTM)标准应运而生。DDS 不仅支持以数据为中心的体系结构,还使用了简单的发布-订阅、点对点通信模式。由于以数据为中心的方法侧重于数据并具有数据模型,因此它能感知正在交换的数据。此外,具有动态发现功能的发布-订阅范式允许新的应用程序订阅或发布数据模型中定义的任何数据,而不会影响系统中的其他应用程序/节点。

发布-订阅系统的好处是,应用程序不需要知道从哪里发送信息或从哪里请求信息。传统的消息系统(如电子邮件)就说明了这一系统弱点:参与者需要确切知道向谁发送邮件。如果有新的人想看这封电子邮件,他需要让发件人知道,这样新的电子邮件地址就可以添加到未来的发件人电子邮件中。

发布-订阅的工作原理更像社交媒体,人们可以发布任何文字、照片或视频,关注该连接的人都会收到更新。如果有新的人对该状态感兴趣,他们只需关注(订阅)该社交媒体账户,就能自动获得更新。我们不需要知道有多少关注者,只要发布一条信息,所有关注者都会收到。在网络术语中,这被称为多播。

DDS 还有另一个有用的功能--订阅者可以对任何数据元素进行过滤,只有在满足过滤条件时才会收到帖子。如果感兴趣的数据发生变化,过滤标准可以随时更改。出版商不需要为适应这些订阅者过滤器而做任何更改。

DDS 具有开放标准和以数据为中心的基础、高度可扩展的组播功能和数据过滤功能,是处理跨不同 JADC2 系统的海量移动数据的管理和交付的理想选择。

RTI Connext: 推动 JADC2 系统的数据中心化

RTI Connext® 是 DDS 标准的商业实施,是在全球 JADC2 系统中实施以数据为中心架构的领先软件连接框架。它建立在点对点、以数据为中心的架构之上,能以线速向人工智能和 ML 系统提供关键的实时数据,无需服务器或中间商。Connext 与网络发现功能松散耦合,实现了网络组件 "即插即用 "功能,可动态插入新功能,并在不触发系统停机的情况下淘汰旧平台。这样,用户就可以在不关闭系统的情况下,在网络中动态插入新功能,并由运营技术自动发现。

Connext 架构在设计上支持 VAULTIS。它的应用编程接口(API)以一致、易懂的格式驱动多种硬件和操作系统平台的访问和可见性。其实时发布-订阅(RTPS)线协议可实现快速、一致的互操作性,而其开放式安全功能可实现跨多个安全域的实时可信访问。Connext 实现了从以网络为中心的系统到以数据为中心的强大环境的清晰、基于开放标准的迁移,在许多情况下使用相同的网络设备,实现了全球 JADC2 系统数据的快速交付和共享。

成为VIP会员查看完整内容
2

人工智能并不是魔法。《AI的工作原理》通过解释发生了什么、何时发生、为何发生、如何发生,并没有使用一条数学方程式,来揭开人工智能的爆炸性增长的神秘面纱,阐明AI实际上在"底层"是怎么运作的。 人工智能无处不在——从自动驾驶汽车,到从文本生成图像,再到像ChatGPT这样的语言系统的无法预料的力量——然而似乎很少有人真正知道这一切是如何运作的。《AI的工作原理》解开了人工智能的奥秘,无需复杂的数学和不必要的术语。 您将学到:

人工智能、机器学习和深度学习之间的关系 人工智能的历史以及为什么人工智能革命现在才发生 符号人工智能经过几十年的研究失败后,为神经网络的出现打开了大门 神经网络是什么,它们是如何被训练的,以及为什么现代AI的所有奇迹都可以归结为一个简单的重复单元,该单元知道如何将输入数字相乘以产生一个输出数字。

像ChatGPT和Bard这样的大型语言模型对我们社会的影响——再也没有什么会像以前一样了

人工智能并不是魔法。如果您曾经想知道它是如何工作的,它能做什么,或者为什么有这么多炒作,《AI的工作原理》将教给您所有您想知道的一切。

成为VIP会员查看完整内容
4

开发机器学习模型严重依赖于对数据的访问。为了建立一个负责任的数据经济体和保护数据所有权,允许来自独立、异构数据源的学习模型而无需集中是至关重要的。联邦学习(FL)旨在在大量的远程设备或孤立组织中集体训练模型,同时保持用户数据的本地性。然而,联邦网络引入了一些超出传统分布式学习场景的挑战。尽管FL对于实现边缘应用展现出巨大的潜力,但当前的FL系统受到几个约束的制约。除了准确性外,联邦方法还必须扩展到潜在的庞大和异构设备网络,并且必须表现出可信的行为—解决与公平性、稳健性和用户隐私等问题相关的实际关注。

在这篇论文中,我们旨在以有原则的方式解决联邦学习的实际挑战。我们研究异质性是如何位于联邦学习的约束的中心—不仅影响模型的准确性,而且与公平性、稳健性和隐私等其他关键指标相竞争。为了解决这些指标,我们开发了新的、可扩展的学习目标和算法,严格考虑和解决异质性的来源。特别是在准确性方面,我们在实际的异质性假设下提出了具有收敛保证的新型联邦优化框架。在可信性方面,我们开发并分析提供灵活公平性/效用权衡的公平学习目标。我们考虑公平性和稳健性之间的联合约束,并探索个性化FL来证明同时解决它们。最后,我们研究了具有改进收敛行为的新型差分私有优化方法,在隐私约束下实现了最先进的性能。 尽管我们的工作是基于联邦学习的应用,我们展示了许多技术和基本权衡不仅仅延伸到这一用例,还延伸到大规模和可信机器学习的更一般应用。

成为VIP会员查看完整内容
1

 1、大模型技术发展历程

  大模型泛指具有数十亿甚至上百亿参数的深度学习模型,而大语言模型是大模型的一个典型分支(以ChatGPT为代表)。Transformer架构的提出引入了注意力机制,突破了RNN和CNN处理长序列的固有局限,使语言模型能在大规模语料上得到丰富的语言知识预训练,一方面,开启了大语言模型快速发展的新时代;另一方面奠定了大模型技术实现的基础,为其他领域模型通过增大参数量提升模型效果提供了参考思路。   复杂性、高维度、多样性和个性化要求使得大型模型在自动驾驶、量化交易、医疗诊断和图像分析、自然语言处理和智能对话任务上更易获得出色的建模能力。     2、自动驾驶模型迭代路径     自动驾驶算法模块可分为感知、决策和规划控制三个环节,其中感知模块为关键的组成部分,经历了多样化的模型迭代:CNN(2011-2016)——RNN+GAN(2016-2018)——BEV(2018-2020)——Transformer+BEV(2020至今)——占用网络(2022至今)。   特斯拉自动驾驶技术路径的演进可视为自动驾驶技术迭代的风向标,呈现全栈自研、出软硬件的协同发展趋势:软件层面从采用Mobileye到自研Transformer+BEV和占用网络;硬件层面从与Mobileye、英伟达合作到自研FSD芯片方案。     3、大模型对自动驾驶行业的赋能与影响     自动驾驶领域的大模型发展相对大语言模型滞后,大约始于2019年,吸取了GPT等模型成功经验。大模型的应用加速模型端的成熟,为L3/L4级别的自动驾驶技术落地提供了更加明确的预期。   可从成本、技术、监管与安全四个层面对于L3及以上级别自动驾驶落地的展望,其中:成本仍有下降空间;技术的发展仍将沿着算法和硬件两条主线并进;法规政策还在逐步完善之中;安全性成为自动驾驶汽车实现商业化落地必不可少的重要因素。   各主机厂自2021年开始加速对L2+自动驾驶的布局,且预计在2024年左右实现L2++(接近L3)或者更高级别的自动驾驶功能的落地,其中政策有望成为主要催化。

成为VIP会员查看完整内容
0

动作知识涉及对动作的文本、视觉和时间方面的理解。我们介绍了动作动力学基准(ActionBench),其中包含两个精心设计的探测任务:动作反义和视频反转,分别针对模型的多模态对齐能力和时间理解技能。尽管近来的视频-语言模型(VidLM)在各种基准任务上的表现令人印象深刻,但我们的诊断任务揭示了它们在动作知识方面的惊人不足(近乎随机性能),这表明当前模型依赖于对象识别能力作为理解动作的捷径。为了补救这一问题,我们提出了一种新颖的框架,PAXION,以及一个新的区分性视频动力学建模(DVDM)目标。PAXION框架利用知识修补网络来编码新的动作知识,并利用知识融合组件将修补器整合到冻结的VidLM中,而不会损害它们现有的能力。由于广泛使用的视频-文本对比(VTC)损失在学习动作知识方面的局限性,我们引入DVDM目标来训练知识修补器。DVDM迫使模型编码动作文本与视频帧正确排序之间的关联。我们的广泛分析显示,PAXION和DVDM一起有效地填补了动作知识理解的差距(~50% → 80%),同时维持或提高了在一系列以对象和动作为中心的下游任务上的表现。

成为VIP会员查看完整内容
0

可控文本生成(CTG)是自然语言生成(NLG)领域中的新兴领域。这被视为发展高级文本生成技术的关键,更好地满足实际应用中的特定约束。近年来,使用大规模预训练语言模型(PLMs),特别是广泛使用的基于Transformer的PLMs,已经成为NLG的新范式,允许生成更多样化和流利的文本。然而,由于深度神经网络的可解释性水平有限,这些方法的可控性需要得到保证。为此,使用基于Transformer的PLMs进行可控文本生成已成为一个快速发展但具有挑战性的新研究热点。在过去的3-4年中,已经出现了各种各样的方法,针对需要不同类型的受控约束的不同CTG任务。在本文中,我们对这一领域的常见任务、主要方法和评估方法进行了系统的批判性综述。最后,我们讨论了该领域面临的挑战,并提出了各种有前景的未来方向。据我们所知,这是第一篇从基于Transformer的PLMs的角度总结最先进的CTG技术的综述论文。我们希望它能帮助相关领域的研究人员和从业人员快速追踪学术和技术前沿,为他们提供该领域的全景图和未来研究的路线图。

自然语言生成(NLG)被视为自然语言理解(NLU)的补充,是自然语言处理(NLP)的一个重要分支。与NLU的任务相反,NLU旨在消除输入文本的歧义,产生文本中所表达的思想的单一标准化表示,而NLG主要关注将潜在表示转换为特定的、自洽的自然语言文本[47]。换句话说,NLU旨在开发能够阅读和理解人类语言的智能机器,而NLG使计算机能够像人类一样写作。作为先进人工智能的一种体现,NLG技术在一系列应用中发挥着关键作用,例如对话系统、广告、市场营销、故事生成和数据增强。

在NLG中实现文本生成的可控制性是一个重要且基本的问题。图1中展示了一些具体的例子。一般来说,一个NLG系统应该能够可靠地生成满足目标应用和用户施加的某些可控制约束的文本。一般来说,这些约束是特定于任务的。例如,故事生成的任务总是需要控制故事情节和结局。在对话响应生成的任务中,经常需要控制情绪[67]、人格[160]和礼貌等。对于基于生成的数据增强[42],必须确保不同领域中的数据分布平衡。而且,对于AI应用的道德发展[6],避免生成无意识和攻击性的内容,如性别偏见、种族歧视和有毒的词,是至关重要的。因此,一个NLG系统的可控制性对于它在实际应用中生成显著实际价值是至关重要的。近年来,深度学习(DL)的发展催生了一系列关于DL驱动的可控文本生成(CTG)的研究,这为这一领域带来了真正的突破。早期的方法基于顺序模型和风格嵌入[34,65],取得了一些有前景的进展。之后,基于深度生成模型的方法激增,例如变分自编码器(VAEs)[48, 125, 138, 142, 149, 154],生成对抗网络(GANs)[117, 140],和能量基础模型[8, 25, 135, 166]。基于深度学习的方法能够以数据驱动的方式进行端到端学习,学习能够隐式表示文本语言特征的低维度稠密向量。这种表示也有助于避免手工特征的偏见,而且在文本生成中显示出巨大的潜力。

然而,上述基于DL的方法的成功在很大程度上依赖于大规模数据集,这对于监督和跨领域文本生成任务提出了挑战。自2018年以来,例如BERT[27],RoBERTa[82],GPT[107],T5[108]和mBART[80]等大规模预训练语言模型(PLMs)逐渐成为NLP的新范式。由于使用了大量语料库和基于Transformer结构的无监督学习,人们相信PLMs从数据中学到了大量的语义和句法知识,而下游任务只需要进行微调就可以获得最先进(SOTA)的性能。在NLG方面,PLMs从大量的语料材料中学习,以很大程度上模拟自然语言的分布,因此它们能够生成前所未有的高质量文本[25]。而且,大规模的PLM本身可以被视为一个消息丰富的知识库,使得生成文本无需外部领域知识。尽管如此,PLMs基于神经网络,本质上仍然是黑箱,缺乏良好的可解释性。这些模型总是根据上下文的潜在表示生成文本。因此,很难控制它们按照人类的意愿生成内容(即,可控性问题)。如何提高基于PLM模型的可解释性和可控性,以生成文本已成为一个热门的研究话题。

在上述应用和研究背景下,基于PLMs的方法正在成为可控文本生成(CTG)研究的主流,有望带来里程碑式的进展。作为一个迅速增长但充满挑战的研究领域,亟需对当前的文献进行全面的批判性回顾,以绘制该领域的全貌,并为有前途的未来方向提出一条路线图。已经有一些关于CTG的调查[100],但它们缺少(1)CTG的代表性应用任务、主要方法和评估方法的系统性回顾;(2)对最新的大规模基于PLM的CTG方法的追踪。在本文中,我们提供了一个关于与CTG相关的主要任务和评估指标的介绍,对使用PLMs的CTG方法进行了详细而全面的文献回顾,最后,对可能的未来研究方向提出了展望。我们希望这篇调查论文将帮助研究人员和从业人员快速捕捉到基于PLM的CTG的整体画面以及详细的前沿方法,并促进这一有前途的领域的进一步发展。

本文的其余部分按照如下组织:第2部分简要介绍了该领域的两个关键方面,即CTG和PLMs的基本概念。然后,我们将基于PLM的CTG的主要方法分为三类,并在第3部分更详细地讨论它们。第4部分总结了CTG的相关评估方法和指标。在第5部分,我们讨论了该领域正在面临的挑战,并提出了一些有前途的未来方向。最后,我们在第6部分结束本文。本文中出现的所有文献都遵循两个规则。首先,我们倾向于选择最近3-4年内出现的最新论文,以确保调查工作的时效性。其次,我们更倾向于选择在NLP社区有影响力的工作,例如,在NLP领域的顶级会议或期刊上发表的论文,如ACL,EMNLP,NAACL和TACL;以及在开源社区中得到广泛关注或被高度引用的工作。

基于PLM的CTG主要方法

从生成的角度来看,PLM已从大规模语料库中学到了各种知识,这可以帮助产生更流利和更丰富多样的文本,为自然语言生成提供了一种有效的方式。然而,现有的PLM本质上还是像其他深度神经网络一样的黑箱模型,缺乏文本生成过程的可解释性和可控制性。如何在实现生成模型的可控性的同时,充分利用PLM进行文本生成,最近已成为一个热门的研究课题。在本节中,我们将从基于Transformer的PLM用于CTG的角度,对该领域的主要方法进行全面的回顾。

基于PLM的CTG的核心思想是以显式或隐式的方式给模型一个控制信号,来驱动满足控制条件的文本生成。根据控制信号的作用方式,我们大致将现有的方法分为三个类别,每个类别进一步分为几个子类。在图4中给出了一个概述。最直接的方法是微调PLM,这可以以较低的成本执行CTG任务。第二种方法是为CTG重新训练或重构PLM。原则上,这种方法可能产生更好的结果,但可能消耗更多的计算资源,也面临着缺乏标记数据的问题。随着PLM的参数大小迅速增加,即使是微调也变得资源密集。为了解决这些问题,第三类文本生成方法,即在解码时间工作的后处理方法,已经出现。在后处理方法中,PLM始终是固定的,控制信号在解码阶段工作。这样的方法不仅需要较少的计算资源进行训练,而且在一定程度上也能保证生成文本的更好质量。因此,近年来学术界对这个方向的关注正在增加。在以下几节中,我们将更详细地回顾与这三种类型的方法相关的最近文献。评价方法自然语言生成(NLG)模型的性能由适当的评估指标来反映。由于需要满足控制元素,可控文本生成(CTG)与一般的NLG任务略有不同。因此,CTG不仅关注生成文本的质量,还关注生成文本是否满足控制元素。因此,我们通常使用一般和CTG特定的指标来评估CTG模型。对于任何CTG模型,评估生成文本的一般质量是至关重要的,例如:1)流利度:输出文本中的语言有多流利[12, 31],2)事实性:生成的文本在多大程度上反映了上下文中描述的事实[46, 146],3)语法:生成的文本在语法上是否正确,4)多样性:生成的文本是否具有多种类型或风格的范围。这些一般评价方面的测量方法可以基于执行评估的对象(如图7所示)分为三类:人类或机器。

结论在这篇论文中,我们全面总结了基于大型预训练语言模型的可控文本生成的典型应用、主要方法和评估方法。通过对现有方法的关键分析,我们识别了该领域的一系列关键挑战,并突出了几个有前途的未来方向。大型预训练语言模型为可控文本生成技术的发展带来了前所未有的机会,呼吁更多的研究人员加入该领域,开创新时代。我们希望这篇文献综述能够为研究人员和从业人员提供该领域的清晰图景,并为他们前进设定路线图。

成为VIP会员查看完整内容
0

从这里开始,本书将为您提供一些基础代码示例和解释。然后将列出几个不同的编程挑战,这些挑战是以下主题的组合:• 基础数据结构 • 使用哈希表 • 遍历数组 • 函数式编程 每个问题都会有一个解释,详细说明如何处理问题并找出一个高级解决方案,然后呈现一个工作的代码解决方案。有些挑战将从一个暴力解决方案开始,然后将慢慢修改成一个更高效的程序。所有的挑战都会有JavaScript、Python和Ruby的工作解决方案。

我的最终目标不是让您记住一系列常见挑战的解决方案。相反,我的目标是让您学会如何处理编程挑战,以便您能够弄清楚它们在问什么,以及您需要什么数据结构和算法来解决它们。真正学会编写问题的解决方案需要时间、练习和对您所使用的编程语言的良好掌握。在本书中,我希望教给您大多数编程挑战之间的共同主题,并向您展示如何使用特定的数据结构和算法来解决几乎每一个挑战。

成为VIP会员查看完整内容
12
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员