本教程的目标读者是对帮助机器理解自然语言文本(特别是文本中描述的真实事件)的人工智能技术感兴趣的研究人员和实践者。这些方法包括提取一个事件关于其主角、参与者和属性的内部结构,以及关于多个事件的成员关系、时间和因果关系的外部结构。本教程将向读者系统地介绍(i)事件的知识表示,(ii)自动提取、概念化和预测事件及其关系的各种方法,(iii)事件过程和属性的归纳,以及(iv)大量受益于上述技术的NLU和常识理解任务。我们将概述这一领域中出现的研究问题,以此结束本教程。
https://cogcomp.seas.upenn.edu/page/tutorial.202102/
人类语言总是涉及对现实世界事件的描述。因此,对事件的理解在自然语言理解中起着至关重要的作用。例如,叙事预测可以通过学习事件的因果关系来预测故事接下来会发生什么;机器理解文件可能包括理解影响股票市场的事件,描述自然现象或识别疾病表型。事实上,事件理解在诸如开放域问题回答、意图预测、时间轴构建和文本摘要等任务中也广泛地发现了它的重要用例。由于事件不只是简单的、独立的谓词,对事件理解的前沿研究通常面临两个关键挑战。一个挑战是精确地归纳事件之间的关系,这些关系描述了事件的成员关系、共同参照、时间顺序和因果关系。另一种是理解事件的内在结构和属性,涉及其参与者、粒度、位置和时间。
在本教程中,我们将全面回顾文献中以事件为中心的知识表示的现有范式,并关注它们对NLU任务的贡献。除了介绍事件提取的部分标签和无监督学习方法外,我们还将讨论最近的约束学习和结构化推理方法,用于从文本中提取多方面的事件-事件关系。我们还将回顾最近用于事件预测任务的数据驱动方法,包括事件过程归纳和概念化,以及以事件为中心的语言模型如何有利于叙事预测。此外,我们将说明远程监督的方法如何帮助解决对事件的时间和因果常识的理解,以及如何应用它们来构建大规模的可能性知识库。与会者将了解该主题的最新趋势和新出现的挑战,获得现成模型的代表性工具和学习资源,以及相关模型和技术如何有利于最终使用的NLU应用。