除了以实体为中心的知识(通常以知识图谱(knowledge Graph, KG)的形式组织起来),事件也是世界上必不可少的一种知识,它引发了以事件为中心的知识表示形式(Event KG, EKG)的兴起。它在许多机器学习和人工智能应用中发挥着越来越重要的作用,如智能搜索、问题回答、推荐和文本生成。本文从历史、本体、实例和应用视图等方面对EKG进行了全面的综述。为了更全面地描述EKG,我们将重点关注它的历史、定义、模式归纳、获取、相关的代表性图形/系统和应用程序。研究了其发展过程和趋势。我们进一步总结了未来EKG研究的发展方向。

知识图谱(KG)是谷歌在2012年发布的一种流行的知识表示形式。它关注名义实体及其关系,因此代表静态知识。然而,世界上存在着大量的事件信息,传递着动态的程序性知识。因此,以事件为中心的知识表示形式(如Event KG (EKG))也很重要,它将实体和事件结合在一起。它促进了许多下游应用,如智能搜索、问答、推荐和文本生成[1]、[2]、[3]、[4]、[5]。

本文就EKG的概念及其发展进行了深入的探讨。关于EKG你想知道什么?你可能会对它的产生感兴趣,也就是所谓的EKG,如何构建它,以及它的进一步应用。为了全面介绍EKG,我们从历史、本体论、实例和应用视图等方面对其进行了介绍。从历史的观点,我们介绍了EKG的简史和我们导出的EKG的定义。从本体的角度,提出了与EKG相关的基本概念,以及EKG相关的任务和方法,包括事件模式归纳、脚本归纳和EKG模式归纳。从实例视图,我们详细阐述了事件获取和与EKG相关的代表图/系统。具体来说,事件获取的重点是如何构建一个基本的EKG,并获得一个更好的EKG。前者包括事件抽取和事件关系抽取,是最基本的任务。后者包括事件相互引用解析和事件参数补全。从应用的角度,介绍了一些基本的应用,包括脚本事件预测和时间KG预测,以及一些深层次的应用,如搜索、问答、推荐和文本生成。并对相关任务的发展过程和趋势进行了深入的研究和分析。然后指出未来的方向。

事件知识图谱发展历程

什么是EKG?历史视角

在本节中,我们将从历史的视角,简要介绍EKG的历史。然后我们根据历史上与EKG相关的概念推导出EKG的定义。

什么是EKG?本体视角

从本体的角度来看,我们研究了模式和相关的任务。EKG的模式描述了构成它的基本概念,比如事件类型、事件参数的角色以及事件之间的关系。事件类型和事件参数的角色构成了事件的框架,即事件模式。对于事件之间的关系,典型的脚本[30]根据一些事件关系组织一组事件,这些事件关系共同描述了常见的场景。

未来方向与挑战

关于EKG的研究和成果有很多。然而,仍有几个方向需要关注和进一步研究。在本节中,我们将深入探讨这些未来的方向。

高性能的事件获取

最近的事件获取研究在有效性和效率上远远不能满足应用需求。特别是事件提取和事件关系提取的精度较低。从而阻碍了高质量基础EKG的构建。此外,现有的模型通常不重视复杂性问题。然而,高参数复杂度和高时间复杂度的模型不利于从大量数据中快速构建EKG。因此,高效率的事件获取是未来的一个重要方向。

多模态知识处理

在现实世界中,事件可能以文本、图像、音频和视频的形式呈现。然而,现有的关于EKG的研究多集中在文本处理上,而忽略了图像、音频、视频中的大量信息。对于多模态事件表示学习[214]和事件抽取[215]的研究很少。实际上,不同模态的事件可以消除歧义,相互补充。因此,多模态信息的联合利用是未来的一个重要方向。具体来说,来自所有模态的事件应在一个统一的框架中表示,事件获取研究应注意多模态提取,EKG图推理也应考虑多模态信息。

可解释EKG研究

在EKG研究中,研究主要集中在用深度学习方法拟合训练数据。然而,它们通常缺乏可解释性,也就是说,对于它们为什么和如何工作没有明确的想法。实际上,了解最终结果的原因有助于在实际应用中采用它们。它是友好和令人信服的解释为什么最终结果是给定的。未来可解释性EKG的研究将是一个重要的方向。

实用EKG研究

在与EKG相关的任务中,有些任务的形式化过于理想化,与现实场景相距甚远。例如,在一个现有的事件中,只完成一个缺失的参数或参数角色,通过从几个候选对象中选择它来预测未来的脚本事件,并且只预测未来事件的一个元素。在更实际的形式下进行研究更具挑战性,但也更有趣,对应用具有重要意义。

EKG对于许多都很重要,包括智能搜索、问题回答、推荐和文本生成。本文从不同角度对EKG的研究进行了综述。特别地,我们深入研究了EKG的历史、本体、实例和应用视图。它的历史,定义,模式归纳,获取,相关的代表图/系统,和应用进行了深入的研究。根据其发展趋势,进一步总结了未来EKG研究的展望方向。

成为VIP会员查看完整内容
0
50

相关内容

知识图谱(KG)是一种用图模型来描述知识和建模事物之间关联关系的技术.知识图谱嵌入(KGE)作为一种被广泛采用的知识表示方法,其主要思想是将知识图谱中的实体和关系嵌入到连续的向量空间中,用来简化操作,同时保留KG的固有结构.它可以使得多种下游任务受益,例如KG补全和关系提取等.首先对现有的知识图谱嵌入技术进行全面回顾,不仅包括使用KG中观察到的事实进行嵌入的技术,还包括添加时间维度的动态KG嵌入方法,以及融合多源信息的KG嵌入技术.对相关模型从实体嵌入、关系嵌入、评分函数等方面进行分析、对比与总结.然后简要介绍KG嵌入技术在下游任务中的典型应用,包括问答系统、推荐系统和关系提取等.最后阐述知识图谱嵌入面临的挑战,对未来的研究方向进行展望.

http://www.jos.org.cn/jos/article/abstract/6429

成为VIP会员查看完整内容
0
41

本教程针对的是对帮助机器理解自然语言文本的人工智能技术感兴趣的研究人员和从业者,特别是文本中描述的真实世界事件。这些方法包括提取关于一个事件的主角、参与者和属性的内部结构,以及关于多个事件的成员关系、时间和因果关系的外部结构。本教程将为读者提供一个系统的介绍 (i) 事件的知识表示,(ii) 自动提取、概念化和预测事件及其关系的各种方法,(iii) 事件过程和属性的归纳,和(iv) 广泛的NLU和常识性理解任务。我们将通过概述这一领域中出现的研究问题来结束本教程。

https://cogcomp.seas.upenn.edu/page/tutorial.202108/

人类语言总是涉及对现实世界事件的描述。因此,对事件的理解在自然语言理解中起着至关重要的作用。例如,叙述预测得益于学习事件的因果关系,从而预测故事接下来会发生什么;机器理解文档可能包括理解影响股市的事件、描述自然现象或识别疾病表型。事实上,事件理解在诸如开放领域问答、意图预测、时间轴构建和文本摘要等任务中也有广泛的重要应用。由于事件不只是简单的、独立的谓词,对事件理解的前沿研究通常面临两个关键挑战。一个挑战是精确地归纳事件的关系,它描述了事件的隶属关系、共参照、时间顺序和因果关系。另一种是理解事件的内在结构和属性,涉及到它的参与者、粒度、位置和时间。

在本教程中,我们将全面回顾文献中关于以事件为中心的知识表示的现有范式,并关注它们对NLU任务的贡献。除了引入用于事件抽取的部分标签和无监督学习方法外,我们还将讨论最近用于从文本中抽取多面事件-事件关系的约束学习和结构化推理方法。我们还将回顾最近用于事件预测任务的数据驱动方法,包括事件过程归纳和概念化,以及以事件为中心的语言模型如何有利于叙事预测。此外,我们将说明远距离监督方法如何帮助解决时间和因果常识对事件的理解,以及如何运用它们来构建大规模的事件知识库。参与者将了解这个主题的最新趋势和新出现的挑战,代表性工具和学习资源,以获得即用模型,以及相关模型和技术如何使最终使用NLU应用程序受益。

目录内容:

  • 引言
  • 事件信息提取
  • 事件过程预测
  • 事件知识获取
  • 事件摘要
  • 事件研究问题
成为VIP会员查看完整内容
0
45

基于模式的事件提取是及时理解事件本质内容的关键技术。随着深度学习技术的快速发展,基于深度学习的事件提取技术成为研究热点。文献中提出了大量的方法、数据集和评价指标,因此需要进行全面和更新的调研。本文通过回顾最新的方法填补了这一空白,重点关注基于深度学习的模型。我们总结了基于模式的事件提取的任务定义、范式和模型,然后详细讨论每一个。我们引入了支持预测和评估指标测试的基准数据集。本综述还提供了不同技术之间的综合比较。最后,总结了今后的研究方向。

引言

事件抽取(EE)是信息抽取研究中的一个重要而富有挑战性的课题。事件作为一种特殊的信息形式,是指在特定时间、特定地点发生的涉及一个或多个参与者的特定事件,通常可以描述为状态的变化。事件提取任务旨在将此类事件信息从非结构化的纯文本中提取为结构化的形式,主要描述现实世界中事件发生的“谁、何时、何地、什么、为什么”和“如何”。在应用方面,该任务便于人们检索事件信息,分析人们的行为,促进信息检索、智能问答、知识图谱构建等实际应用。

事件提取可分为两个层次:基于模式的事件提取[17,62]和基于开放域的事件提取[3,42]。在基于模式的事件抽取任务中,事件被认为是特定的人和对象在特定的时间和地点进行交互的客观事实。基于模式的事件提取[25]是寻找属于特定事件模式的单词,即发生的动作或状态变化,其提取目标包括时间、地点、人、动作等。在开放域事件提取任务[44]中,事件被认为是一组主题的相关描述,可以通过分类或聚类形成。基于开放领域的事件提取是指获取与特定主题相关的一系列事件,通常由多个事件组成。无论是基于模式还是开放域事件提取任务,事件提取的目的是从大量文本中捕获我们感兴趣的事件类型,并以结构化的形式显示事件的基本参数。

我们主要关注基于模式的事件抽取,它已经有了大量的工作,是一种比较成熟的研究分类。基于模式的事件提取从文本中发现事件提到,并提取包含事件触发器和事件参数的事件。事件提到是包含一个或多个触发器和参数的句子。事件提取需要识别事件、分类事件类型、识别参数并判断参数角色。触发器识别和事件分类可分为事件检测任务。参数识别和参数角色分类可以定义为参数提取任务。事件分类是一个多标签文本分类任务,用于对每个事件的类型进行分类。角色分类任务是一种基于词对的多分类任务,确定句子中任意一对触发器和实体之间的角色关系。因此,事件提取可以依赖于一些NLP任务的结果,如命名实体识别(NER)、语义解析和关系提取。

我们给出了事件抽取流程图,如图1所示。首先,对于给定的文本,有必要区分文本中的事件类型。对于不同的事件类型,设计了不同的事件模式。目前,事件模式的设计主要包括手工设计和模型生成两种方式。然后,根据模式提取事件参数。在早期阶段,将元素提取作为一个词分类任务,对文本中的每个词进行分类。此外,还有序列标记和机器阅读理解(MRC)方法。最后,由于事件抽取任务的复杂性,研究者考虑引入外部知识来提高模型性能。

近年来,深度学习方法在很多领域得到了应用,深度学习模型能够自动有效地提取句子中的重要特征。与传统的特征提取方法相比,深度学习方法可以自动提取特征。它可以对语义信息进行建模,并在更高的层次上自动组合和匹配触发特征。这些方法的有效性在自然语言处理中得到了验证,并取得了许多突破。在事件提取任务中使用深度学习可以使许多研究人员消除特征提取工作。

大多数基于深度学习的事件提取方法通常采用监督学习,这意味着需要高质量的大数据集。ACE 2005[13]是少数可用的标记事件数据之一,手动标记新闻,博客,采访和其他数据。ACE数据规模小是影响事件提取任务发展的主要因素。依赖人工标注语料库数据耗时耗力,导致现有事件语料库数据规模小、类型少、分布不均匀。事件提取任务可能非常复杂。一个句子中可能有多个事件类型,不同的事件类型将共享一个事件参数。同样的论点在不同事件中的作用也是不同的。根据抽取范式,基于模式的抽取方法可分为基于管道的抽取方法和基于联合的抽取方法。对基于管道的模型学习事件检测模型,然后学习参数抽取模型。联合事件提取方法避免了触发器识别错误对参数提取的影响,但不能充分利用事件触发器的信息。到目前为止,最好的事件提取方法是基于联合的事件提取范例。

对于传统的事件提取方法,需要进行特征设计,而对于深度学习事件提取方法,可以通过深度学习模型进行端到端的特征提取。综合分析了现有的基于深度学习的事件提取方法,并对未来的研究工作进行了展望。本文的主要贡献如下:

  • 介绍了事件提取技术,回顾了事件提取方法的发展历史,指出基于深度学习的事件提取方法已成为主流。我们根据表1中发表年份总结了深度学习模型的必要信息,包括模型、领域、场所、数据集和子任务。

  • 我们详细分析了各种基于深度学习的提取范式和模型,包括它们的优缺点。我们介绍了现有的数据集,并给出了主要评价指标的制定。我们在表3中总结了主要数据集的必要信息,如类别的数量,语言和数据地址。

  • 我们在表5中总结了ACE 2005数据集上的事件提取准确度得分,并讨论了事件提取面临的未来研究趋势,从而总结了综述。

成为VIP会员查看完整内容
0
44

推荐系统旨在为用户推荐个性化的在线商品或信息, 其广泛应用于众多Web场景之中, 来处理海量信息数据所导致的信息过载问题, 以此提升用户体验. 鉴于推荐系统强大的实用性, 自20世纪90年代中期以来, 研究者针对其方法与应用两方面, 进行了大量广泛的研究. 近年来, 很多工作发现知识图谱中所蕴含的丰富信息可以有效地解决推荐系统中存在的一系列关键问题, 例如数据稀疏、冷启动、推荐多样性等. 因此, 本文 针对基于知识图谱的推荐系统这一领域进行了全面的综述. 具体地, 首先简单介绍推荐系统与知识图谱中的一些基本概念. 随后, 详细介绍现有方法如何挖掘知识图谱不同种类的信息并应用于推荐系统. 此外, 总结了相关的一系列推荐应用场景. 最后, 提出了对基于知识图谱的推荐系统前景的看法, 并展望了该领域未来的研究方向.

成为VIP会员查看完整内容
0
226

摘要: 知识图谱以图结构表示丰富灵活的语义,描述客观世界的事物及其关系,在应用领域得到了广泛的关注。事件知识图谱聚焦动态事件及其间的顺承、时序和因果关系,并以结构化的图形式表示,对海量数据更高效地管理。尤其是对动态事件信息和事件逻辑关系的挖掘,对认识客观世界发展规律,助力领域多种智能应用有着重要的意义。本文系统阐述事件知识图谱的构建技术,包括事件知识表示、事件知识抽取、事件关系抽取,并介绍事件知识图谱在领域的典型应用,最后介绍现阶段的挑战与研究展望。

成为VIP会员查看完整内容
0
90

摘要: 在自然语言处理领域,信息抽取一直以来受到人们的关注.信息抽取主要包括3项子任务:实体抽取、关系抽取和事件抽取,而关系抽取是信息抽取领域的核心任务和重要环节.实体关系抽取的主要目标是从自然语言文本中识别并判定实体对之间存在的特定关系,这为智能检索、语义分析等提供了基础支持,有助于提高搜索效率,促进知识库的自动构建.综合阐述了实体关系抽取的发展历史,介绍了常用的中文和英文关系抽取工具和评价体系.主要从4个方面展开介绍了实体关系抽取方法,包括:早期的传统关系抽取方法、基于传统机器学习、基于深度学习和基于开放领域的关系抽取方法,总结了在不同历史阶段的主流研究方法以及相应的代表性成果,并对各种实体关系抽取技术进行对比分析.最后,对实体关系抽取的未来重点研究内容和发展趋势进行了总结和展望.

http://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2020.20190358#1

成为VIP会员查看完整内容
0
119
小贴士
相关VIP内容
专知会员服务
41+阅读 · 2021年11月11日
专知会员服务
44+阅读 · 2021年7月6日
专知会员服务
226+阅读 · 2020年8月10日
专知会员服务
90+阅读 · 2020年8月6日
专知会员服务
71+阅读 · 2020年8月2日
专知会员服务
119+阅读 · 2020年7月19日
中文知识图谱构建技术以及应用的综述
专知会员服务
230+阅读 · 2019年10月19日
相关资讯
事件知识图谱构建技术与应用综述
专知
12+阅读 · 2020年8月6日
开放域知识库问答研究回顾
PaperWeekly
4+阅读 · 2020年8月4日
【SCIR笔记】文档级事件抽取简述
深度学习自然语言处理
15+阅读 · 2020年7月30日
知识图谱最新研究综述
深度学习自然语言处理
33+阅读 · 2020年6月14日
论文解读|知识图谱最新研究综述
AINLP
13+阅读 · 2020年5月4日
知识图谱实体链接:一份“由浅入深”的综述
PaperWeekly
3+阅读 · 2020年1月8日
事件知识图谱构建研究进展与趋势
THU数据派
58+阅读 · 2019年12月11日
知识图谱嵌入(KGE):方法和应用的综述
AI科技评论
70+阅读 · 2019年8月26日
综述 | 知识图谱发展概述
PaperWeekly
63+阅读 · 2017年11月3日
【知识图谱】中文知识图谱构建方法研究
产业智能官
85+阅读 · 2017年10月26日
相关论文
Saiping Guan,Xueqi Cheng,Long Bai,Fujun Zhang,Zixuan Li,Yutao Zeng,Xiaolong Jin,Jiafeng Guo
7+阅读 · 2021年12月31日
CSKG: The CommonSense Knowledge Graph
Filip Ilievski,Pedro Szekely,Bin Zhang
17+阅读 · 2020年12月21日
Kian Ahrabian,Aarash Feizi,Yasmin Salehi,William L. Hamilton,Avishek Joey Bose
3+阅读 · 2020年9月23日
Talking-Heads Attention
Noam Shazeer,Zhenzhong Lan,Youlong Cheng,Nan Ding,Le Hou
12+阅读 · 2020年3月5日
Liang Yao,Chengsheng Mao,Yuan Luo
9+阅读 · 2019年9月11日
Yu Sun,Shuohuan Wang,Yukun Li,Shikun Feng,Xuyi Chen,Han Zhang,Xin Tian,Danxiang Zhu,Hao Tian,Hua Wu
3+阅读 · 2019年4月19日
Zhongyang Li,Xiao Ding,Ting Liu
10+阅读 · 2018年5月16日
Paul Embrechts,Matthias Kirchner
3+阅读 · 2017年6月13日
Top
微信扫码咨询专知VIP会员