【学界】融合对抗学习的因果关系抽取

2018 年 7 月 14 日 GAN生成式对抗网络

来源:自动化学报

因果关系是“原因”和“结果”之间的关系,是引起和被引起的关系. 因果关系作为一种重要的关系类型,在许多任务中起着重要作用,如事件预测、情景生成、问答以及文本蕴涵等.

自然语言文本中存在大量的因果关系. 新闻文本中经常报道事故及其造成的后果:

The arrest has caused an outcry of indignation among some industrial and political circles in France.

该例包含了arrest(逮捕)和outcry(强烈抗议)之间的因果关系. 

因果关系的抽取方法主要分为两类:基于模式匹配的方法和基于机器学习的方法. 基于模式匹配的方法包括词典语法模式,语义关系模式等. 基于机器学习的方法包括支持向量机(Support Vector Machine,SVM)、决策树(Decision Tree)等. 这些方法主要依赖特征工程,但是特征工程涵盖了繁琐的特征选择和不准确的特征提取,计算开销大且存在错误传播的问题. 此外,以往的方法利用WordNet,NomLex-Plus以及VerbNet等知识库抽取特征,对知识库依赖性强. 

图1  GAN 结构

为避免特征工程的一系列问题,本文将在因果关系抽取任务上探索新的方法. 自2014年以来,Goodfellow等人提出的生成式对抗网络GAN在生成式任务上取得巨大进展. GAN在结构上受到博弈论的启发,系统由一个生成模型和一个判别模型构成,如图1. 生成模型捕捉真实数据样本的潜在分布,并生成新的数据样本;判别模型是一个二分类器,判别输入是真实数据还是生成的样本. 判别模型的存在使得 GAN 中的生成模型能够学习去逼近真实数据,最终让其生成的数据达到以假乱真的地步. 与传统基于模式匹配和机器学习的抽取方法相比,GAN能够利用生成模型和判别模型之间的对抗,获取逼近训练目标的生成模型.

图2  模型整体架构

针对已有因果关系抽取方法在特征工程中存在的问题,本文提出了一个包含因果关系解释信息的对抗学习框架,分别将原始语句和包含因果关系解释信息的语句输入到基本模型和因果关系增强模型,利用两个相同结构的神经网络模型进行因果关系分类. 通过基本模型和判别模型的对抗训练,基本模型能模仿和学习因果关系增强模型生成的特征向量,进而捕获模型间共同特征,提升因果关系抽取效果.

图3  带注意力机制的双向门控循环单元神经网络

引用格式

冯冲, 康丽琪, 石戈, 黄河燕. 融合对抗学习的因果关系抽取. 自动化学报, 2018, 44(5): 811-818

作者简介

冯冲,北京理工大学计算机学院副研究员. 主要研究方向为自然语言处理, 信息抽取, 机器翻译. 本文通信作者.  

E-mail: fengchong@bit.edu.cn

康丽琪,北京理工大学计算机学院硕士研究生. 主要研究方向为信息抽取,关系

抽取.  

E-mail: klq207@126.com

石戈,北京理工大学计算机学院博士研究生. 主要研究方向为信息抽取,事件抽取.  

E-mail: shige@bit.edu.cn

黄河燕,北京理工大学计算机学院教授. 主要研究方向为自然语言处理和机器翻译社交网络与信息检索, 智能处理系统.  

E-mail: hhy63@bit.edu.cn



高质量延伸阅读

【学界】第1届“智能车辆中的平行视觉”研讨会成功举行

【学界】生成式对抗网络:从生成数据到创造智能

【学界】OpenPV:中科院研究人员建立开源的平行视觉研究平台

【学界】基于平行视觉的特定场景下行人检测

【学界】ParallelEye:面向交通视觉研究构建的大规模虚拟图像集

【CFP】Virtual Images for Visual Artificial Intelligence

【最详尽的GAN介绍】王飞跃等:生成式对抗网络 GAN 的研究进展与展望

【智能自动化学科前沿讲习班第1期】王飞跃教授:生成式对抗网络GAN的研究进展与展望

【智能自动化学科前沿讲习班第1期】王坤峰副研究员:GAN与平行视觉

【重磅】平行将成为一种常态:从SimGAN获得CVPR 2017最佳论文奖说起

【平行讲坛】平行图像:图像生成的一个新型理论框架

【学界】基于生成对抗网络的低秩图像生成方法

【学界】Ian Goodfellow等人提出对抗重编程,让神经网络执行其他任务

【学界】六种GAN评估指标的综合评估实验,迈向定量评估GAN的重要一步

【资源】T2T:利用StackGAN和ProGAN从文本生成人脸

【学界】 CVPR 2018最佳论文作者亲笔解读:研究视觉任务关联性的Taskonomy

【业界】消失的CV公司

登录查看更多
15

相关内容

关系抽取指的是检测和识别文本中实体之间的语义关系,并将表示同一语义关系的提及(mention)链接起来的任务。关系提取任务需要在一组工件(通常来自文本或XML文档)中对语义关系提及进行检测和分类。该任务与信息抽取(IE)的任务非常相似,但是IE还需要删除重复关系(消除歧义),并且通常指的是提取许多不同的关系。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
因果关联学习,Causal Relational Learning
专知会员服务
182+阅读 · 2020年4月21日
【Science最新论文】XAI—可解释人工智能简述,机遇与挑战
专知会员服务
163+阅读 · 2019年12月21日
论文浅尝 | 利用问题生成提升知识图谱问答
开放知识图谱
20+阅读 · 2019年11月5日
技术动态 | 跨句多元关系抽取
开放知识图谱
50+阅读 · 2019年10月24日
论文浅尝 | 基于知识库的自然语言理解 04#
开放知识图谱
14+阅读 · 2019年3月14日
论文浅尝 | 基于知识库的类型实体和关系的联合抽取
开放知识图谱
35+阅读 · 2018年12月9日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
【学界】基于生成对抗网络的低秩图像生成方法
GAN生成式对抗网络
9+阅读 · 2018年7月13日
【学界】生成式对抗网络:从生成数据到创造智能
GAN生成式对抗网络
6+阅读 · 2018年6月14日
Advances and Open Problems in Federated Learning
Arxiv
18+阅读 · 2019年12月10日
Arxiv
4+阅读 · 2018年4月26日
Arxiv
10+阅读 · 2018年4月19日
VIP会员
相关VIP内容
因果关联学习,Causal Relational Learning
专知会员服务
182+阅读 · 2020年4月21日
【Science最新论文】XAI—可解释人工智能简述,机遇与挑战
专知会员服务
163+阅读 · 2019年12月21日
相关资讯
论文浅尝 | 利用问题生成提升知识图谱问答
开放知识图谱
20+阅读 · 2019年11月5日
技术动态 | 跨句多元关系抽取
开放知识图谱
50+阅读 · 2019年10月24日
论文浅尝 | 基于知识库的自然语言理解 04#
开放知识图谱
14+阅读 · 2019年3月14日
论文浅尝 | 基于知识库的类型实体和关系的联合抽取
开放知识图谱
35+阅读 · 2018年12月9日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
【学界】基于生成对抗网络的低秩图像生成方法
GAN生成式对抗网络
9+阅读 · 2018年7月13日
【学界】生成式对抗网络:从生成数据到创造智能
GAN生成式对抗网络
6+阅读 · 2018年6月14日
Top
微信扫码咨询专知VIP会员