由CMU和USC/ISI联合开发的OPERA系统(面向运行的概率提取、推理和分析)是针对DARPA的“对不同方案的主动解释”(AIDA)计划的综合解决方案,其形式是:(i) 针对文本、语音和图像/视频数据的高性能媒体分析(TA1),(ii) 语义表示和推理支持(TA1和TA2),(iii) 跨媒介和跨语言整合(TA2),和(iv) 假设创建、管理和假设探索(TA3)。鉴于这样一个系统的所有必要组成部分仍然是活跃的研究领域,创建一个单一的系统(流水线或其他方式)有可能出现大量的复合错误率。早期创建的系统版本有很强的抽象边界,用于系统之间有限的信息共享。后来的化身得益于允许提取器的输出与原始文本字符串和嵌入向量相耦合。在存在编码世界知识的大规模语言模型的情况下,以及在将预测与开放领域的本体(如WikiData)相一致时,这些证明是特别有利的。

DARPA的“对不同方案的主动解释”(AIDA)计划的目标是开发一个多假设语义引擎,它可以从各种非结构化的来源产生对事件、情况和趋势的明确的替代解释。这些事件可能是自然灾害或国际冲突,在这些事件中,分析人员往往很快就会被大量嘈杂、冲突和可能具有欺骗性的信息所淹没,这使得他们很难理解什么是相关的以及如何做出适当的反应。AIDA引擎必须能够从多种语言和媒体来源中自动提取知识元素,汇总来自这些来源的信息,并生成和探索关于正在发生的事件的多种备选假设,然后可以呈现给用户(如情报分析员)并由其进行互动探索。

CMU在这次合作中的作用集中在TA1和TA2上--创建文件间和文件内或模式表示。

  • 文件内 在单个文件内,系统必须对实体、事件和关系进行准确的提取。这种精确性与召回率的阈值必须适合于丰富的假说表述,而没有不适当的噪音传播。提取器还需要在多语言和从视觉上操作。这里同时采用了高精度的专家注释方法和高召回率的学习技术。

  • 文件间 一旦建立了本地知识实体,它们就会在文件和模式间进行聚类,以开始类似证据的统一。

USC/ISI在这一合作中的作用是设计和开发表示机制和软件组件,以提供以下高级功能:

  • 通用语义库,它提供了一个表示形式、本体、存储库、推理引擎和API,以存储、访问、映射、消除歧义和链接由TA1模块生成或由分析师直接输入的知识元素(KEs)。

  • 假设生成和管理,生成和管理语义上连贯的假设,这些假设在某种最低程度上得到OPERA可用证据的支持,并记录和管理备选方案,允许在假设推理器的指导下进行回溯和撤回。

AIDA计划的目标非常宏大,对处理这些问题的各个团队提出了极其困难的技术和工程挑战。鉴于所有不同的输入模式、语言、媒体类型、源和提取噪声,以及对知识元素提取、推理、链接、查询、跨组件和跨团队集成、容器化和端到端系统自动化的要求,所产生的系统变成了极其复杂和难以构建、测试和调试的系统,特别是在一个学术、非商业研究环境中。最终的组件构成了庞大的代码库,每个代码库都有几万行。这个非常可观的代码库的很大一部分集中在工程和集成问题上,而这些问题对于整个系统的性能来说往往比许多有趣的技术问题更重要,这些问题也必须解决。

成为VIP会员查看完整内容
56

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
万字译文《海战中实施人工智能的挑战》2023最新报告
专知会员服务
185+阅读 · 2023年5月6日
《多模态语义分割》美国空军2023年最新38页报告
专知会员服务
70+阅读 · 2023年4月25日
【NAACL2022】信息提取前沿
专知会员服务
58+阅读 · 2022年7月11日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年6月5日
A Survey of Large Language Models
Arxiv
399+阅读 · 2023年3月31日
Arxiv
82+阅读 · 2022年7月16日
VIP会员
相关资讯
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员