论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

2018 年 11 月 1 日 开放知识图谱

事件抽取的目标是在非结构化的文本中确认事件的触发词（Eventtrigger）和参与者（Event argument），并判断触法词的事件类型（Eventtype），判断参与者在事件中的扮演的角色（Argument role）。有触发词和参与者的短语或文本称为EventMention。如下图的关于Transport-Person 事件的一条EventMention，dispatching是触发词，下划线是参与者，其中China作为Agent参与事件。

目前大多数的事件抽取是基于已有的手动标记样本进行训练。常见的数据集ACE，总共有8个大类，33个小类，对每个类，有人为标记的训练语料。但是对于没有样本的新事件类型，用上述语料训练的模型会显得无力。对此，一是可以用远程监督的方法标记训练样本，二是用迁移学习方法。本文基于第二点的，提出在事件抽取任务中用零样本迁移学习方法：将event mention 和event ontology联合映射到共享的语义空间上，拉近两者在语义空间上的距离。

具体来说：对于新的语料，可以用AMR得到具体事件mention的结构，同时提供已定义好的关于事件类型ontology的结构。如上图所示，是对上述E1进行处理后得到mention的结构和一些已定义好的ontology结构。可以看到，事件触发词和事件类型名通常有一些共享含义，同时，两者的结构也趋于相似。本文基于这两点，将mention和ontology的结构表示联合映射到同一语义空间，最小化mention和对应的ontology的语义距离，从而学习一个通用映射函数，将已有样本训练得到的模型迁移到没有样本的事件中，整体框架如下：

分为如下几步：

1. 找出候选触发词和候选参与者，称为Tiggerand Argument Identification

用WSD找出触发词候选项，并用FrameNet中的Lexical units匹配文本扩充触发词候选项；利用ARMparser找出参与者候选项。

2. 确定触发词对应的事件类型，称为 Tigger Classification

触发词分类主要是用CNN模型，模型的输入考虑了两个部分 [V_t,V_(S_t)]：V_t 触发词本身的语义表示，可以用word2vec来训练；触发词t的结构是 S_t，V_(S_t)是 S_t 的表示； ontology的 [V_y,V_(S_y)] 输入同理。

对于 V_(S_t)，分两步进行：首先结构中的每条边，可以表示为 u=<w_1,λ,w_2>，用 M_λ 表示关系，可以得到每个元组的表示 V_u，对应公式如下；之后将 t 的所有元组的表示 V_u 拼接起来，输入到CNN网络中，得到V_(S_t)。

对于 V_(S_y)，ontology的每个元祖表示为 u^'=<y,r>, y 是事件类型，r 是参与者角色， V_u' 的表示如下，之后也输入到CNN中得到 V_(S_y)。

通过hinge loss来训练模型，将mention和ontology的表示学习到同一语义空间：

3. 确定参与者在事件中扮演的角色，称为ArgumentClassification

参与角色的分类是基于触发词到参与者路径的相似度。仍以E1为例，通过将dispatch-01—>:ARG0—>China和Transport-Person—>Agent的路径信息学习到同一语义空间，之后根据语义相似度判断China在Transport-Person中的扮演的角色是Agent。

4. 预测新类别

测试时候，对于新的 t'，用训练好的模型得到 t' 的结构化表示和所有ontology的结构化表示，距离最近的就是预测的结果。

本文进行了比较丰富的实验：

1. 在ACE数据集上进行实验，实验中可见类设置如下，N表示可见类的数量：

上述设置下得到的效果如下，WSD-Embedding没有将结构信息考虑到迁移的过程中。可以在迁移学习过程中考虑更多的机构化信息，得到的效果更好；可见类越多，效果越好。

2. 用ACE的 Justice类的4个小类做训练，用其余三个或用其他大类下随机的一个小类作测试。可以看到，测试类跟训练类的相似度越高，效果越好。

3. 使用LSTM在所有类上进行训练和测试，和用ZSL进行训练和测试的效果对比。可以看到用ZSL训练得到的效果和用LSTM训练近500条样本得到的效果不相上下。

笔记整理：王若旭，浙江大学硕士，研究方向为知识图谱，自然语言处理.

OpenKG.CN

中文开放知识图谱（简称OpenKG.CN）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

转载须知：转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题，请注明原标题。

点击阅读原文，进入 OpenKG 博客。

登录查看更多

相关内容

事件抽取

关注 56

事件抽取指的是从非结构化文本中抽取事件信息，并将其以结构化形式呈现出来的任务。例如从“毛泽东1893 年出生于湖南湘潭”这句话中抽取事件{类型：出生，人物：毛泽东，时间：1893 年，出生地：湖南湘潭}。事件抽取任务通常包含事件类型识别和事件元素填充两个子任务。

【ICML2020】深度神经网络置信感知学习，Conﬁdence-Aware Learning for Deep Neural Networks

专知会员服务

74+阅读 · 2020年7月6日

零样本文本分类，Zero-Shot Learning for Text Classification

专知会员服务

97+阅读 · 2020年5月31日

近期必读的6篇顶会WWW 2020【迁移学习（Transfer Learning）】相关论文

专知会员服务

75+阅读 · 2020年4月29日

【异构图迁移的零样本学习】Heterogeneous Graph-based Knowledge Transfer for Generalized Zero-shot Learning

专知会员服务

66+阅读 · 2020年4月17日

最新必读的8篇「小样本学习（few-shot learning）」2020顶会论文和代码

专知会员服务

239+阅读 · 2020年3月2日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

专知会员服务

159+阅读 · 2020年2月29日

【斯坦福大学-论文】实体上下文关系路径的知识图谱补全

专知会员服务

104+阅读 · 2020年2月20日

【AAAI 2020】将深度学习与逻辑融合用于信息提取（Integrating Deep Learning with Logic Fusion for Information Extraction）

专知会员服务

66+阅读 · 2019年12月28日

【ICCV 2019 Workshop】Adaptive Confidence Smoothing for Generalized Zero-Shot Learning，巴伊兰大学 Yuval Atzmon

专知会员服务

13+阅读 · 2019年10月31日

【ICCV 2019 Workshop】Universal Features – Information Extraction for Transfer Learning（迁移学习中的信息提取），麻省理工学院（MIT）郑立中教授

专知会员服务

23+阅读 · 2019年10月30日

论文浅尝 | 面向时序知识图谱推理的循环事件网络

开放知识图谱

78+阅读 · 2019年9月22日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART III）

AINLP

25+阅读 · 2019年8月21日

论文浅尝 | 使用循环神经网络的联合事件抽取

开放知识图谱

25+阅读 · 2019年4月28日

综述 | 事件抽取及推理 (上)

开放知识图谱

87+阅读 · 2019年1月9日

论文浅尝 | 基于知识库的类型实体和关系的联合抽取

开放知识图谱

35+阅读 · 2018年12月9日

论文浅尝 | 基于局内去噪和迁移学习的关系抽取

开放知识图谱

16+阅读 · 2018年12月2日

论文浅尝 | 用图网络做小样本学习

开放知识图谱

66+阅读 · 2018年6月30日

论文浅尝 | Distant Supervision for Relation Extraction

开放知识图谱

4+阅读 · 2017年12月25日

论文浅尝 | Reinforcement Learning for Relation Classification

开放知识图谱

9+阅读 · 2017年12月10日

Open Domain Event Extraction Using Neural Latent Variable Models

Arxiv

4+阅读 · 2019年6月17日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

End-to-End Learning for Answering Structured Queries Directly over Text

Arxiv

3+阅读 · 2018年11月16日

Rapid Customization for Event Extraction

Arxiv

7+阅读 · 2018年9月20日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

An Attentive Sequence Model for Adverse Drug Event Extraction from Biomedical Text

Arxiv

3+阅读 · 2018年1月2日

Train Once, Test Anywhere: Zero-Shot Learning for Text Classification

Arxiv

4+阅读 · 2017年12月23日

Scale Up Event Extraction Learning via Automatic Training Data Generation

Arxiv

7+阅读 · 2017年12月11日

Zero-Shot Transfer Learning for Event Extraction

Arxiv

10+阅读 · 2017年7月4日

VIP会员