这项工作是DARPA资助的Active Interpretation of Disparate Alternatives(AIDA,对不同选择的积极解释)项目的一部分,该项目旨在自动建立一个知识库,可以通过查询来战略性地生成关于事件的不同方面的假设。我们作为TA1团队参与了这个项目,并开发了一个管道,可以整合文本和视觉输入,并处理这些多模态数据以捕捉由实体、事件和关系代表的事件。我们开发了基于图表示的方法,通过借鉴文本中确定的依赖关系,或借鉴我们开发的一种新方法,使用关联嵌入来创建视频上的图表示。由此产生的结构是一个知识图谱,通过查询可以战略性地产生关于事件不同方面的假设。

在我们的现代世界中,事件和情况迅速铺展,产生了大量的互联网文章、照片和视频。对这些丰富的信息进行自动分类的能力将使我们能够确定哪些信息是最重要和最可信的,以及趋势是如何随着时间的推移展开的。在本文中,我们提出了对网络上大量政治数据进行分类的系统第一部分。我们的系统接受原始的多模态输入(如文本、图像和视频),并生成一个以有意义的方式连接实体、事件和关系的知识图谱。

我们的项目是DARPA资助的Active Interpretation of Disparate Alternatives (AIDA)项目的一部分,该项目旨在自动建立一个知识库,可以通过查询来战略性地生成关于一个事件的不同方面的假说。我们作为TA1团队参与了这个项目,建立了整个系统的第一步。

我们的方法在图1中概述,并将在以下章节中详细讨论。该管道的第一步是预处理,如图1最上面一行所示。原本以多种语言书写的原始文本文件被翻译成英文,音频和视频片段被转录并翻译成英文。这些经过翻译的数据被传递到管道的第二阶段(图1的中间一行)。在这里,相关的实体(例如,人、地方、国家)被提取出来,这些实体被用来提取连接实体的关系和事件。最后,这些实体、事件和关系被传递到管道的最后阶段(图1的底行)。我们输出一个完全成型的知识图,代表我们从原始输入文档中收集到的信息。这个知识图谱包括实体以及它们之间的联系。

图1:AIDA的整体管道。我们的系统部分接收原始文本文件(左上)和音频和视频(右上),并输出一个知识图谱(右下)。

成为VIP会员查看完整内容
74

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
北大关于知识图谱与图数据库的研究工作
专知会员服务
36+阅读 · 2022年8月13日
COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
42+阅读 · 2020年7月2日
最新综述!基于图神经网络的关系抽取技术进展
技术动态 | 多模态知识图谱
开放知识图谱
37+阅读 · 2020年8月5日
连载 | 知识图谱发展报告 2018 -- 前言
开放知识图谱
18+阅读 · 2018年10月7日
漆桂林 | 知识图谱的应用
机器学习研究会
12+阅读 · 2017年9月26日
漆桂林 | 知识图谱之语义网络篇
开放知识图谱
19+阅读 · 2017年8月12日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
An Attentive Survey of Attention Models
Arxiv
44+阅读 · 2020年12月15日
Arxiv
20+阅读 · 2019年9月7日
Arxiv
15+阅读 · 2018年4月5日
VIP会员
相关VIP内容
北大关于知识图谱与图数据库的研究工作
专知会员服务
36+阅读 · 2022年8月13日
COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
42+阅读 · 2020年7月2日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员