美国陆军目前的数据架构十分复杂,主要集中在用于移动和共享数据的网络、系统和信息协议上。这种架构重点造成了过多的数据重复和保留,减少了数据共享,阻碍了数据驱动决策的优势地位。陆军必须从目前以网络/系统为中心的架构转型为以数据为中心的部队。按照陆军部长的指示,更快地按需向决策者提供数据将有助于加快任务执行并取得成功。
图 1. 当前数据架构的复杂性阻碍了美国陆军的决策优势地位
为应对这一挑战,负责采购、后勤和技术的陆军助理部长(ASA(ALT) 负责数据、工程和软件(DES)的陆军副助理部长(DASA)定义了这一统一数据参考架构(UDRA)。该 UDRA 引入了数据网格原则,以扁平化和简化陆军的数据架构,简化任务合作伙伴之间的数据产品共享,并以更快的速度和更大的规模支持数据驱动决策。
本 UDRA 符合国防部数据战略目标、国防部(DoD)首席数字和人工智能官(CDAO)数据网格方法、美国陆军数据计划和决策驱动数据行动概念(CONOPS)。该 UDRA 通过纳入反馈机制来推动数据产品的内容和质量,为满足士兵对数据的需求提供了手段。它描述并定义了用于自助式数据产品发现和消费的服务。该 UDRA 包括传输无关的数据交换,可支持各层次的各种网络,减少数据的复制和持久性。它还利用联合治理,实现全球和本地治理政策的自动执行。该 UDRA 下放了数据产品的责任和权限,以提高数据质量,增强陆军在数据域之间共享数据产品的能力。最终,该 UDRA 将为获取以数据为中心的能力提供指导,并提高陆军作为联合/联合作战部队的效率。
一般来说,UDRA 是一个概念,而不是一个系统或记录计划 (PoR)。然而,作为一种参考架构,UDRA 为项目管理人员和计划与产品经理(PMs/PdMs)提供了设计和实施解决方案(包括人员、程序、技术和权衡)的左右边界指导,从而为作战人员提供所需的能力。该 UDRA 进一步定义了 "决策驱动数据 CONOPS "中确定的数据生态系统,符合 UDRA 的合同语言将适用于新能力开发和收购的行业解决方案。UDRA 将为衡量解决方案的合规性和一致性提供标准。
美国陆军 CDAO 和陆军数据委员会负责陆军的数据管理组织和政策。本 UDRA 中的任何内容都无意抵触或取代它们的政策和指导。本 UDRA 为数据网格原则的系统级实施提供指导,以便高效、有效地执行陆军 CDAO 数据治理。具体而言,计算治理使系统能够自动执行由适当数据治理机构制定的政策。
本节包括按概念顺序排列的关键术语和定义。附录 G 提供了更多细节和术语。
数据生态系统(Data Ecosystem)--生产士兵驱动的领域所属数据产品所需的人员、流程和工具的集合,使决策主导所需的分析成为可能。(资料来源--2022 年,ASA(ALT)/DASA(DES)与训练与条令司令部(TRADOC)/卓越任务指挥中心(MCCoE)之间的合作成果)。
数据网--一种基于联合和分散方法的数据架构,用于分析数据的生产、管理和共享。其特点是联合治理、自助服务基础设施平台、将数据作为产品对待和提供,以及对其数据负责的自主数据域。
数据域 - 具有特定功能专长的组织,它生产数据产品与消费者共享信息,并可消费其他数据域生产的数据产品。陆军实施的数据域由陆军管理部门定义。指定的任务区数据官确定任务区内的数据域,并指派一名数据管理员对该域进行治理和政策控制。
数据集 - 相关数据项的集合,未经数据网格中使用所需的整理和包装。在 UDRA 中,数据产品团队使用其领域拥有的数据集和其他数据集生产数据产品,以满足其消费者的信息需求。
数据产品 - 为满足用户的任务或业务需求而制作的预先打包的数据和元数据集。数据产品设计为高质量、易于使用、可自我描述和可计算。
网格服务 - 用于生产、消费、协调和互操作共享数据产品的自动化服务集合。
数据平台 - 用于安全管理域内数据的一套模块化开放系统技术和基础设施。数据平台使数据域能够生产、公开、检索和消费符合数据网格的数据产品。
终端用户设备 - 指挥官、参谋或士兵用于获取和使用数据产品以支持决策的个人计算机、工作站或移动设备。
作为一种指导思想,本 UDRA 以士兵为主导、以领域为依托、以数据产品为基础,以加快人员、流程、技术和管理政策执行的运行节奏,从而实现更快的数据驱动决策和任务执行。本 UDRA 基于以下指导原则。
这些 UDRA 原则将不断发展,而不是一成不变。随着本 UDRA 的更新,可能会确定、定义、批准和实施更多原则。
图 2 描述了 UDRA 数据网格概念的主要功能、参与者和角色。
图 2. 数据网格关键功能、参与者和角色