The argument role in event extraction refers to the relation between an event and an argument participating in it. Despite the great progress in event extraction, existing studies still depend on roles pre-defined by domain experts. These studies expose obvious weakness when extending to emerging event types or new domains without available roles. Therefore, more attention and effort needs to be devoted to automatically customizing argument roles. In this paper, we define this essential but under-explored task: open-vocabulary argument role prediction. The goal of this task is to infer a set of argument roles for a given event type. We propose a novel unsupervised framework, RolePred for this task. Specifically, we formulate the role prediction problem as an in-filling task and construct prompts for a pre-trained language model to generate candidate roles. By extracting and analyzing the candidate arguments, the event-specific roles are further merged and selected. To standardize the research of this task, we collect a new event extraction dataset from WikiPpedia including 142 customized argument roles with rich semantics. On this dataset, RolePred outperforms the existing methods by a large margin. Source code and dataset are available on our GitHub repository: https://github.com/yzjiao/RolePred
翻译:事件提取中的争论作用指事件与参与其中的争论之间的关系。 尽管事件提取过程中取得了巨大进展, 现有的研究仍然取决于领域专家预先确定的角色。 这些研究在扩展到没有可用角色的新兴事件类型或新领域时暴露出明显的弱点。 因此, 需要将更多的注意力和精力用于自动定制争论角色。 在本文件中, 我们定义了这项重要但探索不足的任务: 开放式词汇争论角色预测 。 任务的目的是为特定事件类型推导一套没有监管的争论角色 。 我们提议了一个新的、 不受监管的框架, 用于这项任务 。 具体地说, 我们将角色预测问题设计成一个完成中的任务, 并构建一个经过预先培训的语言模型来生成候选角色的提示 。 通过提取和分析候选论点, 具体事件的角色将被进一步合并和选择 。 为了对这项任务的研究进行标准化, 我们从 WikikiPreppedia 收集了一个新的事件提取数据集, 包括142个与富有的语义化角色 。 关于此数据设置, 角色定位超越了我们现有的方法, 以大边缘 。 MAPreb/ Pregree 数据设置 。