本教程针对的是对帮助机器理解自然语言文本的人工智能技术感兴趣的研究人员和从业者,特别是文本中描述的真实世界事件。这些方法包括提取关于一个事件的主角、参与者和属性的内部结构,以及关于多个事件的成员关系、时间和因果关系的外部结构。本教程将为读者提供一个系统的介绍 (i) 事件的知识表示,(ii) 自动提取、概念化和预测事件及其关系的各种方法,(iii) 事件过程和属性的归纳,和(iv) 广泛的NLU和常识性理解任务。我们将通过概述这一领域中出现的研究问题来结束本教程。
https://cogcomp.seas.upenn.edu/page/tutorial.202108/
人类语言总是涉及对现实世界事件的描述。因此,对事件的理解在自然语言理解中起着至关重要的作用。例如,叙述预测得益于学习事件的因果关系,从而预测故事接下来会发生什么;机器理解文档可能包括理解影响股市的事件、描述自然现象或识别疾病表型。事实上,事件理解在诸如开放领域问答、意图预测、时间轴构建和文本摘要等任务中也有广泛的重要应用。由于事件不只是简单的、独立的谓词,对事件理解的前沿研究通常面临两个关键挑战。一个挑战是精确地归纳事件的关系,它描述了事件的隶属关系、共参照、时间顺序和因果关系。另一种是理解事件的内在结构和属性,涉及到它的参与者、粒度、位置和时间。
在本教程中,我们将全面回顾文献中关于以事件为中心的知识表示的现有范式,并关注它们对NLU任务的贡献。除了引入用于事件抽取的部分标签和无监督学习方法外,我们还将讨论最近用于从文本中抽取多面事件-事件关系的约束学习和结构化推理方法。我们还将回顾最近用于事件预测任务的数据驱动方法,包括事件过程归纳和概念化,以及以事件为中心的语言模型如何有利于叙事预测。此外,我们将说明远距离监督方法如何帮助解决时间和因果常识对事件的理解,以及如何运用它们来构建大规模的事件知识库。参与者将了解这个主题的最新趋势和新出现的挑战,代表性工具和学习资源,以获得即用模型,以及相关模型和技术如何使最终使用NLU应用程序受益。
目录内容: