论文浅尝 | 基于注意力图卷积神经网络的依存驱动关系抽取

2022 年 10 月 26 日 开放知识图谱

笔记整理：王大壮

论文链接：https://aclanthology.org/2021.acl-long.344.pdf

动机

句法信息,特别是依存树,已经被广泛应用于关系提取,以更好地分析与给定实体相关联的上下文信息。然而大多数现有的研究都饱受依赖树噪声的影响，特别是当它们自动生成时。由于直接利用依存信息可能会引入混淆，所以需要对依存信息进行筛选。为此，本文通过注意力图卷积神经网络（A-GCN）来辨别不同词依存的重要性，同时考虑到不同依存关系类型对关系分类的作用，在模型中也引入了依存关系类型的信息。

论文方法

关系抽取旨在辨别给定文本中提及的实体之间的关系。

本文方法可以分为以下两步，模型整体框架如下：

1.考虑依存类别的注意力图神经网络

a)通过依存句法树构建邻接矩阵A（存储两次之间是否存在依存关系：两词之间有关系为1，没关系为0）；

b)构建依存类别邻接矩阵T（存储两词之间依存关系类别，比如nsubj）

c)对于每层A-GCN网络，给定上一层第i个词（表示为 $h_i^{l-1}$ ）和第j个词（表示为 $h_j^{l-1}$ ），可以从T中得到对应关系类型，经嵌入表示为 $e_{i, j}^t$ 。

（1）首先使用下式求得第i个词的中间表示：

同理求得第j个词的中间表示：

（2）考虑到不同依存关系应该具有不同的权重。用下式计算当前依存关系的权重：

其中，

a_{i, j}

对应矩阵A（两词之间有关系为1，没关系为0）中的元素。

（3）下一层第i个词的表示经下式得到（加权求和）：

其中，W、b代表一个线性层的参数，

p_{i, j}^{(l)}

代表相应权重，

\tilde{h}_j^{(l-1)}

是依存关系类型增强（考虑到依存关系类别对关系抽取的影响）的词表示，由下式计算：

2.使用A-GCN的关系分类

（1）将输入文本经过BERT得到隐层表示，第i个词表示为

h_i^{(0)}

，将

h_i^{(0)}

传入A-GCN模型得到第L层的输出

h_i^{(L)}

。

（2）接着使用最大池化对属于实体描述范围的词的隐层表示进行处理：

（3）接着用整句文本（ $h_x$ ）的表示和两个实体（ $h_{E_1} 、 h_{E_2}$ ）的表示进行拼接，然后使用一个可训练矩阵来得到输出空间的向量：

（4）最后应用一个softmax函数来预测两个实体之间的关系：

实验

1.实验首先设计了以下几个变量进行比较，实验结果如下：

a)采用BERT-base 或BERT-large

b)进行依存剪枝L+G 或不剪枝Full

c)使用一般的GCN 和GAT

d)对于GCN 和A-GCN使用了不同的层数进行比较

1）使用A-GCN的模型均比BERT-base和BERT-large要好。

2）在所有的数据集同样的设置下，A-GCN均比GAT和GCN的基线要好。

3）对于使用A-GCN的模型，进行依存剪枝L+G的效果均比Full好。

4）使用A-GCN的模型在两层时达到最佳性能。

2.使用上述实验得到的最佳模型设置和之前工作的比较：

可以看到提出的模型达到了最佳效果。

3.使用不同依存信息的比较：

4.消融实验（注意力机制+依存类型）

总结

该论文提出了一种基于注意力图卷积神经网络来利用依存信息用于关系抽取的方法，通过注意力机制来对依存关系及其类型进行加权，从而更好地区分重要的依存信息并加以利用，使得A-GCN可以动态地学习不同的依存关系并剪枝掉无用的依存信息。在两个英文基准数据集上的实验结果证明了提出方法的有效性。

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文，进入 OpenKG 网站。

登录查看更多

相关内容

依存关系

关注 0

KDD 2022 | GraphMAE:自监督掩码图自编码器

专知会员服务

20+阅读 · 2022年7月14日

AAAI 2022｜对抗攻击鲁棒的异质图神经网络

专知会员服务

36+阅读 · 2022年3月28日

WWW2022 | 迷途知返：分布迁移下的图神经网络自训练方法

专知会员服务

17+阅读 · 2022年2月19日

【WWW2022】TaxoEnrich:通过结构语义表示的自监督分类法补全

专知会员服务

14+阅读 · 2022年2月14日

【知识图谱@EMNLP2020】Knowledge Graphs in NLP @ EMNLP 2020

专知会员服务

43+阅读 · 2020年11月22日

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

专知会员服务

42+阅读 · 2020年7月1日

【ACL2020-复旦大学NLP】异构图神经网络的文档摘要提取

专知会员服务

35+阅读 · 2020年5月1日

【斯坦福大学-论文】实体上下文关系路径的知识图谱补全

专知会员服务

104+阅读 · 2020年2月20日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

134+阅读 · 2020年2月13日

【CIKM 2019论文】基于关系型图卷积网络的代理发起的社会化电子商务推荐（Relation-Aware Graph Convolutional Networks for Agent-Initiated Social E-Commerce Recommendation）

专知会员服务

56+阅读 · 2019年11月20日

论文浅尝 | FL-MSRE：一种基于小样本学习的多模态社会关系抽取方法

开放知识图谱

1+阅读 · 2022年9月14日

论文浅尝 | KGNLI: 知识图谱增强的自然语言推理模型

开放知识图谱

0+阅读 · 2022年1月28日

论文浅尝 | 一种基于递归超图的知识图谱问答方法

开放知识图谱

1+阅读 · 2021年9月15日

论文浅尝 | 用于学习知识图谱嵌入的一种基于注意力机制的新型异构 GNN 框架HRAN

开放知识图谱

0+阅读 · 2021年9月5日

论文浅尝 | 面向开放域的无监督实体对齐

开放知识图谱

2+阅读 · 2021年8月24日

论文浅尝 | ICLR2020 - 基于组合的多关系图卷积网络

开放知识图谱

21+阅读 · 2020年4月24日

论文浅尝 | 将文本建模为关系图，用于联合实体和关系提取

开放知识图谱

77+阅读 · 2019年9月14日

论文浅尝 | 利用知识图谱嵌入和图卷积网络进行长尾关系抽取

开放知识图谱

30+阅读 · 2019年7月5日

论文浅尝 | 时序与因果关系联合推理

开放知识图谱

35+阅读 · 2019年6月23日

论文浅尝 | 多内容实体和关系联合抽取的对抗训练

开放知识图谱

42+阅读 · 2018年12月4日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

向量组合学习框架下基于依存混合树的中文语义解析研究

国家自然科学基金

3+阅读 · 2014年12月31日

融合实体和交互上下文信息的社会化推荐方法研究

国家自然科学基金

3+阅读 · 2013年12月31日

并行子空间学习方法及其大规模图像识别应用研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于儿童语言习得机制的语言接地技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

开放域动态事实性信息获取及融合方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

跨语言信息检索中的机器翻译研究

国家自然科学基金

2+阅读 · 2011年12月31日

三维模型语义分析与检索研究

国家自然科学基金

2+阅读 · 2008年12月31日

典型事件过程建模的研究

国家自然科学基金

2+阅读 · 2008年12月31日

面向开放领域的自动关系抽取技术研究

国家自然科学基金

5+阅读 · 2008年12月31日

Multilingual Sequence-to-Sequence Models for Hebrew NLP

Arxiv

0+阅读 · 2022年12月19日

Cross-Lingual Retrieval Augmented Prompt for Low-Resource Languages

Arxiv

0+阅读 · 2022年12月19日

Learning Stance Embeddings from Signed Social Graphs

Arxiv

3+阅读 · 2022年12月15日

K-AID: Enhancing Pre-trained Language Models with Domain Knowledge for Question Answering

Arxiv

15+阅读 · 2021年9月22日

Generalized Multi-Relational Graph Convolution Network

Arxiv

10+阅读 · 2020年6月12日

A survey on Semi-, Self- and Unsupervised Techniques in Image Classification

Arxiv

100+阅读 · 2020年2月20日

Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

Arxiv

10+阅读 · 2019年9月15日

Graph Convolutional Networks for Text Classification

Arxiv

12+阅读 · 2018年9月15日

Linguistically-Informed Self-Attention for Semantic Role Labeling

Arxiv

17+阅读 · 2018年8月28日

Convolutional 2D Knowledge Graph Embeddings

Arxiv

29+阅读 · 2018年4月6日

VIP会员