【索邦大学博士论文】实体与关系抽取中的泛化与上下文化 - 专知VIP

会员服务 ·

14

自然语言处理 · 博士论文 · 泛化性 ·

2022 年 6 月 20 日

【索邦大学博士论文】实体与关系抽取中的泛化与上下文化

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在过去的十年中，神经网络在自然语言处理(NLP)领域已经取得了显著的进展，特别是因为它们能够从大量的未标记语料库中学习相关的单词表征。这些词嵌入可以在监督训练中进行迁移移和微调应用到不同的终端应用。最近，在2018年，整个预训练语言模型的迁移和上下文化能力的保留使得几乎在每一个NLP基准上都达到了前所未有的性能，有时甚至超过了人类的基准。然而，当模型达到如此令人印象深刻的分数时，它们的理解能力仍然显得很肤浅，这揭示了基准的局限性，不能为它们的表现因素提供有用的见解，并准确地衡量理解能力。

在本论文中，我们研究了最SOTA模型在两个重要的信息提取任务(命名实体识别(NER)和关系提取(RE))中关于在未见事实的泛化性能。事实上，传统基准在提到和关系之间存在重要的词汇重叠，用于训练和评估模型，而信息提取的主要兴趣是提取以前未知的信息。我们提出了基于提及和与训练集的关系重叠来分离性能的实证研究，发现预训练的语言模型主要有利于检测未见提及，特别是域外提及。虽然这使得它们适合于真正的用例，但可见和未见提及之间仍然存在性能差距，这不利于对新事实的归纳。特别是，即使是最先进的ERE模型也依赖于浅层记忆启发式，其预测更多地基于论据表面形式而不是上下文。

在这项工作中，我们还巩固了端到端关系提取评估的基础，这一基础被以前的不正确的比较所破坏，并提出了一个更细粒度的评估和理解端到端关系提取模型，以泛化到新的关系。最后，我们提出了在创建未来的模型和数据集时改进上下文合并的想法。

成为VIP会员查看完整内容

31

相关内容

自然语言处理

自然语言处理

自然语言处理（NLP）是语言学，计算机科学，信息工程和人工智能的一个子领域，与计算机和人类（自然）语言之间的相互作用有关，尤其是如何对计算机进行编程以处理和分析大量自然语言数据。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

《基于大型知识库进行问答的非参数化上下文推理》2022最新177页博士论文，马萨诸塞大学阿默斯特分校

《基于大型知识库进行问答的非参数化上下文推理》2022最新177页博士论文，马萨诸塞大学阿默斯特分校

专知会员服务

27+阅读 · 2022年8月5日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

103+阅读 · 2022年7月25日

【AI+ 法律】2022最新博士论文《改进法律文本处理中的注意力神经网络》日本科学技术高等研究院

【AI+ 法律】2022最新博士论文《改进法律文本处理中的注意力神经网络》日本科学技术高等研究院

专知会员服务

19+阅读 · 2022年5月4日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知会员服务

56+阅读 · 2022年4月19日

【博士论文】基于深度学习的联合实体关系抽取

专知会员服务

91+阅读 · 2021年9月4日

【ACL2021】ERICA:通过对比学习提高预训练语言模型的实体和关系理解

专知会员服务

26+阅读 · 2021年8月12日

【NAACL2021】信息解缠正则化持续学习的文本分类

【NAACL2021】信息解缠正则化持续学习的文本分类

专知会员服务

22+阅读 · 2021年4月11日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

专知会员服务

23+阅读 · 2020年4月18日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

63+阅读 · 2019年10月27日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知

9+阅读 · 2022年7月26日

AAAI 2022 | 可解释和鲁棒的联合文本分类及证据提取

AAAI 2022 | 可解释和鲁棒的联合文本分类及证据提取

PaperWeekly

1+阅读 · 2022年3月17日

AAAI 2020论文解读：关注实体以更好地理解文本

AAAI 2020论文解读：关注实体以更好地理解文本

AI科技评论

17+阅读 · 2019年11月20日

NAACL 2019自然语言处理亮点

NAACL 2019自然语言处理亮点

专知

15+阅读 · 2019年6月15日

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

黑龙江大学自然语言处理实验室

15+阅读 · 2018年12月10日

论文浅尝 | 多内容实体和关系联合抽取的对抗训练

论文浅尝 | 多内容实体和关系联合抽取的对抗训练

开放知识图谱

42+阅读 · 2018年12月4日

300页文本知识提取与推断最新教程

300页文本知识提取与推断最新教程

机器学习算法与Python学习

13+阅读 · 2018年8月28日

论文浅尝 | 基于神经网络的实体识别和关系抽取联合学习

论文浅尝 | 基于神经网络的实体识别和关系抽取联合学习

开放知识图谱

23+阅读 · 2018年3月6日

基于神经网络的实体识别和关系抽取联合学习 | PaperWeekly #54

基于神经网络的实体识别和关系抽取联合学习 | PaperWeekly #54

黑龙江大学自然语言处理实验室

19+阅读 · 2017年12月14日

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

产业智能官

25+阅读 · 2017年12月6日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于篇章语义的文档级统计机器翻译研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深层学习的汉语句法语义分析研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于动作概念的本体知识库及在文本处理上的应用

国家自然科学基金

7+阅读 · 2012年12月31日

文本多粒度关系抽取半监督自适应学习的研究

国家自然科学基金

4+阅读 · 2012年12月31日

稳健且有效的回归和变量选择方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于语言模型的通用实体检索建模及框架实现研究

国家自然科学基金

7+阅读 · 2011年12月31日

利用机器学习改进统计机器翻译的研究

国家自然科学基金

0+阅读 · 2009年12月31日

面向开放领域的自动关系抽取技术研究

国家自然科学基金

5+阅读 · 2008年12月31日

应用于面向问题的自动文摘任务的篇章分析关键技术研究

国家自然科学基金

0+阅读 · 2008年12月31日

Adversarial Fine-tuning for Backdoor Defense: Connecting Backdoor Attacks to Adversarial Attacks

Arxiv

0+阅读 · 2022年8月8日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

Knowledge Distillation for Object Detection via Rank Mimicking and Prediction-guided Feature Imitation

Arxiv

11+阅读 · 2021年12月9日

Bayesian Deep Learning via Subnetwork Inference

Arxiv

10+阅读 · 2021年2月18日

Read, Retrospect, Select: An MRC Framework to Short Text Entity Linking

Arxiv

11+阅读 · 2021年1月7日

Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources

Arxiv

13+阅读 · 2019年11月14日

Latent Relation Language Models

Arxiv

21+阅读 · 2019年8月21日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

VIP会员

相关主题

自然语言处理

相关VIP内容

《基于大型知识库进行问答的非参数化上下文推理》2022最新177页博士论文，马萨诸塞大学阿默斯特分校

《基于大型知识库进行问答的非参数化上下文推理》2022最新177页博士论文，马萨诸塞大学阿默斯特分校

专知会员服务

27+阅读 · 2022年8月5日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

103+阅读 · 2022年7月25日

【AI+ 法律】2022最新博士论文《改进法律文本处理中的注意力神经网络》日本科学技术高等研究院

【AI+ 法律】2022最新博士论文《改进法律文本处理中的注意力神经网络》日本科学技术高等研究院

专知会员服务

19+阅读 · 2022年5月4日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知会员服务

56+阅读 · 2022年4月19日

【博士论文】基于深度学习的联合实体关系抽取

专知会员服务

91+阅读 · 2021年9月4日

【ACL2021】ERICA:通过对比学习提高预训练语言模型的实体和关系理解

专知会员服务

26+阅读 · 2021年8月12日

【NAACL2021】信息解缠正则化持续学习的文本分类

【NAACL2021】信息解缠正则化持续学习的文本分类

专知会员服务

22+阅读 · 2021年4月11日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

专知会员服务

23+阅读 · 2020年4月18日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

63+阅读 · 2019年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知

9+阅读 · 2022年7月26日

AAAI 2022 | 可解释和鲁棒的联合文本分类及证据提取

AAAI 2022 | 可解释和鲁棒的联合文本分类及证据提取

PaperWeekly

1+阅读 · 2022年3月17日

AAAI 2020论文解读：关注实体以更好地理解文本

AAAI 2020论文解读：关注实体以更好地理解文本

AI科技评论

17+阅读 · 2019年11月20日

NAACL 2019自然语言处理亮点

NAACL 2019自然语言处理亮点

专知

15+阅读 · 2019年6月15日

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

黑龙江大学自然语言处理实验室

15+阅读 · 2018年12月10日

论文浅尝 | 多内容实体和关系联合抽取的对抗训练

论文浅尝 | 多内容实体和关系联合抽取的对抗训练

开放知识图谱

42+阅读 · 2018年12月4日

300页文本知识提取与推断最新教程

300页文本知识提取与推断最新教程

机器学习算法与Python学习

13+阅读 · 2018年8月28日

论文浅尝 | 基于神经网络的实体识别和关系抽取联合学习

论文浅尝 | 基于神经网络的实体识别和关系抽取联合学习

开放知识图谱

23+阅读 · 2018年3月6日

基于神经网络的实体识别和关系抽取联合学习 | PaperWeekly #54

基于神经网络的实体识别和关系抽取联合学习 | PaperWeekly #54

黑龙江大学自然语言处理实验室

19+阅读 · 2017年12月14日

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

产业智能官

25+阅读 · 2017年12月6日

相关基金

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于篇章语义的文档级统计机器翻译研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深层学习的汉语句法语义分析研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于动作概念的本体知识库及在文本处理上的应用

国家自然科学基金

7+阅读 · 2012年12月31日

文本多粒度关系抽取半监督自适应学习的研究

国家自然科学基金

4+阅读 · 2012年12月31日

稳健且有效的回归和变量选择方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于语言模型的通用实体检索建模及框架实现研究

国家自然科学基金

7+阅读 · 2011年12月31日

利用机器学习改进统计机器翻译的研究

国家自然科学基金

0+阅读 · 2009年12月31日

面向开放领域的自动关系抽取技术研究

国家自然科学基金

5+阅读 · 2008年12月31日

应用于面向问题的自动文摘任务的篇章分析关键技术研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Adversarial Fine-tuning for Backdoor Defense: Connecting Backdoor Attacks to Adversarial Attacks

Arxiv

0+阅读 · 2022年8月8日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

Knowledge Distillation for Object Detection via Rank Mimicking and Prediction-guided Feature Imitation

Arxiv

11+阅读 · 2021年12月9日

Bayesian Deep Learning via Subnetwork Inference

Arxiv

10+阅读 · 2021年2月18日

Read, Retrospect, Select: An MRC Framework to Short Text Entity Linking

Arxiv

11+阅读 · 2021年1月7日

Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources

Arxiv

13+阅读 · 2019年11月14日

Latent Relation Language Models

Arxiv

21+阅读 · 2019年8月21日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

微信扫码咨询专知VIP会员