美国空军转型能力办公室 (TCO) 的一个关键目标是在各种举措中培养转型能力。若要提出、开发和选择要推进到转换功能管道中的概念,TCO 必须从许多数据源中提取信息。机器学习和自然语言处理可用于从文本源中提取信息;但是,还必须有效地应用和利用主题专业知识,以提供创造性的见解并充分利用提取的信息。
为了了解如何使用以人为本的数据增强(HCDE)决策流程来确定哪些概念要进入管道,作者使用了一种多方法定性方法,其中包括对发展规划相关文献的回顾以及对高级领导人的采访,技术专家,以及来自空军和国防界的主题专家。他们的分析综合揭示了TCO使用数据科学工具从能力差距,能力需求和技术解决方案的庞大数据库中提取信息的机会,并使用更多样化的面向未来的决策方法(称为预见方法)来利用人类的专业知识和创造力。他们开发并实施了概念验证语义聚类分析和主题探索工具,以从能力差距和技术的自由文本描述中提取信息,并将数据提取与前瞻性方法相结合,作为HCDE决策过程的一部分。作者在三个案例研究中展示了数据科学工具和远见方法。
可以使用哪些方法来决定将哪些概念推进到空军转型能力管道中?
数据科学工具能否用于从庞大的数据库中提取有关能力差距、能力需求和技术解决方案的信息?
在这些工作中,可以使用哪些方法来利用人类的专业知识和创造力?
TCO的异常广泛的任务要求使用不同于空军其他部(DAF)和国防部组织使用的工具和方法。
能力差距的一些数据源被广泛引用,但它们没有得到集中管理;科学和技术解决方案的数据源更加多样化和多样化,这些来源中包含的数据量非常庞大。
没有软件工具系统地用于解析、提取和总结能力差距和技术解决方案来源的内容。
现代数据科学技术可用于从这些源中包含的自由文本描述中提取信息。
发展规划是一项以人为本的工作,取决于领域知识、创造力和社交网络。
预见方法可用于利用人类的专业知识和创造力。
数据科学技术和预见方法可以集成在一起,形成HCDE决策过程。
空军研究实验室(AFRL)和TCO应使用本报告中描述的概念开发和选择过程。
AFRL和TCO应该使用软件工具,如本报告中所述,从自然语言数据源中提取信息。当他们这样做时,他们应该进行用户测试和验证研究,以改进软件工具。
AFRL应探索替代的自然语言处理方法,以最大限度地提高从自由文本来源提取信息的效用。
DAF 应整理和标准化关键的运营能力差距数据源。
AFRL、DAF 和 TCO 应通过购买或开发清理记录并将其与元数据合并的功能来丰富关键的科学和技术数据源。
TCO应扩大创造性、互动性、专家驱动和循证预测方法的使用。
作为实现HCDE能力发展规划全面管理和标准化的垫脚石,AFRL和TCO应记录人为生成的技术配对,以弥补能力差距。