可学习知识引导的事件因果关系识别数据增强方法

事件因果关系识别(Event Causality Identification, ECI)旨在识别文本中事件之间的因果关系,可以为许多自然语言处理任务提供重要线索,如逻辑推理、问答系统等。ECI任务通常被建模为一个分类问题,即识别一个句子中两个事件之间是否存在因果关系。

目前大多数ECI方法采用监督学习的范式。虽然这些方法取得了很好的性能,但通常需要大规模的标注训练数据。然而,现有的事件因果关系识别数据集相对较少。小规模的标注数据集阻碍了高性能事件因果关系识别模型的训练,无法提供充足的训练数据支撑模型准确理解文本中的事件关系语义。

本文探索了一个知识融合的数据增强方法,利用大量抽取的因果相关事件生成新训练数据,解决ECI任务训练数据缺失问题。该方法包含两个框架,知识增强的事件因果关系数据自动标注框架和知识引导的事件因果关系数据生成框架。其中,知识引导的事件因果关系数据生成框架(Learnable Data Augmentation framework, LearnDA),利用对偶学习机制,将事件因果关系识别器和数据生成器对偶约束,从识别过程中学习如何生成任务相关的新数据,从生成过程中学习如何更准确地理解因果语义,生成高质量表达事件因果语义的新训练数据。

成为VIP会员查看完整内容
33

相关内容

数据增强在机器学习领域多指采用一些方法(比如数据蒸馏,正负样本均衡等)来提高模型数据集的质量,增强数据。
专知会员服务
50+阅读 · 2021年8月13日
专知会员服务
31+阅读 · 2021年7月2日
专知会员服务
38+阅读 · 2021年6月19日
专知会员服务
38+阅读 · 2021年6月6日
【WWW2021】本体增强零样本学习
专知会员服务
32+阅读 · 2021年2月26日
专知会员服务
50+阅读 · 2020年12月26日
远程监督在关系抽取中的应用
深度学习自然语言处理
12+阅读 · 2020年10月26日
论文浅尝 | CoRR - 面向复杂知识问答的框架语义解析方法
ACL 2019 | 面向远程监督关系抽取的模式诊断技术
CVPR2019 | 医学影像:MIT 利用学习图像变换进行数据增强
计算机视觉life
26+阅读 · 2019年3月27日
【学界】融合对抗学习的因果关系抽取
GAN生成式对抗网络
15+阅读 · 2018年7月14日
学界 | 香港科技大学提出L2T框架:学习如何迁移学习
七月在线实验室
7+阅读 · 2017年8月23日
VIP会员
相关VIP内容
专知会员服务
50+阅读 · 2021年8月13日
专知会员服务
31+阅读 · 2021年7月2日
专知会员服务
38+阅读 · 2021年6月19日
专知会员服务
38+阅读 · 2021年6月6日
【WWW2021】本体增强零样本学习
专知会员服务
32+阅读 · 2021年2月26日
专知会员服务
50+阅读 · 2020年12月26日
相关资讯
远程监督在关系抽取中的应用
深度学习自然语言处理
12+阅读 · 2020年10月26日
论文浅尝 | CoRR - 面向复杂知识问答的框架语义解析方法
ACL 2019 | 面向远程监督关系抽取的模式诊断技术
CVPR2019 | 医学影像:MIT 利用学习图像变换进行数据增强
计算机视觉life
26+阅读 · 2019年3月27日
【学界】融合对抗学习的因果关系抽取
GAN生成式对抗网络
15+阅读 · 2018年7月14日
学界 | 香港科技大学提出L2T框架:学习如何迁移学习
七月在线实验室
7+阅读 · 2017年8月23日
微信扫码咨询专知VIP会员