DeepStruct: 面向结构化预测任务的预训练语言模型 | 论文荐读 - 专知

会员服务 ·

0

DeepStruct: 面向结构化预测任务的预训练语言模型 | 论文荐读

2022 年 3 月 22 日 学术头条

作者：

Chenguang Wang, Xiao Liu, Zui Chen, Haoyun Hong, Jie Tang, Dawn Song

Chenguang Wang, Xiao Liu, Zui Chen, Haoyun Hong, Jie Tang, and Dawn Song. DeepStruct: Pre-Training of Language Models for Structure Prediction. In Proceedings of the 60th Annual Meeting of the Association of Computational Linguistics (Findings of ACL'22).

本文介绍了一种提高语言模型的结构理解能力的方法。与以往面向特定任务设计和优化模型不同，我们对语言模型进行预训练，使其在一系列与任务无关的语料库上从文本中生成结构化的预测。我们的结构预训练使模型在结构任务方面所学到的知识得到零的转移。我们在 27 个数据集上研究了这种方法的性能，这些数据集横跨 10 个结构预测任务，包括开放信息提取、联合实体和关系提取、命名实体识别、关系分类、语义角色标记、事件抽取、指代消歧、知识探测、意图检测和对话状态跟踪。我们通过特定任务的训练集进一步进行多任务学习。我们表明，一个百亿参数的语言模型可以轻松地转移到大多数任务上，并以单一模型在我们评估的 27 个数据集中的 20 个上获得了最先进的性能。

点击【在看】及时获取更多讯息

登录查看更多

2

相关内容

结构化预测

结构化预测

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知会员服务

29+阅读 · 2022年1月28日

基于大型预训练语言模型的自然语言处理研究进展综述

基于大型预训练语言模型的自然语言处理研究进展综述

专知会员服务

96+阅读 · 2021年11月4日

【Hinton新论文】语言建模目标检测Pix2seq

【Hinton新论文】语言建模目标检测Pix2seq

专知会员服务

26+阅读 · 2021年9月23日

【CIKM2021】超链接预训练信息检索

专知会员服务

17+阅读 · 2021年8月24日

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

专知会员服务

71+阅读 · 2021年7月31日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【AAAI2020】实体关系联合抽取的编码器-解码器结构的有效建模（ Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extraction）

【AAAI2020】实体关系联合抽取的编码器-解码器结构的有效建模（ Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extraction）

专知会员服务

53+阅读 · 2019年11月22日

P-tuning v2: 提示微调方法可在跨规模和任务上与精调方法媲美 | 论文荐读

P-tuning v2: 提示微调方法可在跨规模和任务上与精调方法媲美 | 论文荐读

学术头条

2+阅读 · 2022年4月11日

信息抽取新SOTA！首个结构化生成式信息抽取预训练模型，一统信息抽取四大任务

信息抽取新SOTA！首个结构化生成式信息抽取预训练模型，一统信息抽取四大任务

PaperWeekly

7+阅读 · 2022年4月8日

有效且稳健的数据增强小样本学习 | 论文荐读

有效且稳健的数据增强小样本学习 | 论文荐读

学术头条

6+阅读 · 2022年3月25日

小样本自然语言理解的基准测试FewNLU | 论文荐读

小样本自然语言理解的基准测试FewNLU | 论文荐读

学术头条

1+阅读 · 2022年3月23日

基于自回归填空的通用语言模型预训练 | 论文荐读

基于自回归填空的通用语言模型预训练 | 论文荐读

学术头条

5+阅读 · 2022年3月14日

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知

0+阅读 · 2022年1月28日

论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

开放知识图谱

1+阅读 · 2021年11月11日

论文浅尝 | 将结构预测作为增广自然语言间的翻译任务

论文浅尝 | 将结构预测作为增广自然语言间的翻译任务

开放知识图谱

0+阅读 · 2021年9月1日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

无监督分词及词性归纳联合方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

指挥控制任务共同体的机制和模型研究

国家自然科学基金

35+阅读 · 2013年12月31日

三维模型在异构空间中的语义迁移方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向海量数据语义标注众包的任务管理方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

科技论文的语义模式研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于词义的文档表示模型及多语亚文档主题分析研究

国家自然科学基金

0+阅读 · 2012年12月31日

文本语义模型和子空间聚类研究

国家自然科学基金

1+阅读 · 2009年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

面向查询的XML文本自动文摘研究

国家自然科学基金

0+阅读 · 2008年12月31日

Subset selection for linear mixed models

Arxiv

1+阅读 · 2022年4月18日

Transductive Learning for Abstractive News Summarization

Arxiv

0+阅读 · 2022年4月16日

Revisiting joint decoding based multi-talker speech recognition with DNN acoustic model

Revisiting joint decoding based multi-talker speech recognition with DNN acoustic model

Arxiv

0+阅读 · 2022年4月15日

ML_LTU at SemEval-2022 Task 4: T5 Towards Identifying Patronizing and Condescending Language

ML_LTU at SemEval-2022 Task 4: T5 Towards Identifying Patronizing and Condescending Language

Arxiv

0+阅读 · 2022年4月15日

Consecutive Decoding for Speech-to-text Translation

Arxiv

0+阅读 · 2022年4月15日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Reinforced Self-Attention Network: a Hybrid of Hard and Soft Attention for Sequence Modeling

Arxiv

16+阅读 · 2018年1月31日

A Structured Self-attentive Sentence Embedding

Arxiv

24+阅读 · 2017年3月9日

VIP会员

相关主题

结构化预测

预训练语言模型

相关VIP内容

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知会员服务

29+阅读 · 2022年1月28日

基于大型预训练语言模型的自然语言处理研究进展综述

基于大型预训练语言模型的自然语言处理研究进展综述

专知会员服务

96+阅读 · 2021年11月4日

【Hinton新论文】语言建模目标检测Pix2seq

【Hinton新论文】语言建模目标检测Pix2seq

专知会员服务

26+阅读 · 2021年9月23日

【CIKM2021】超链接预训练信息检索

专知会员服务

17+阅读 · 2021年8月24日

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

专知会员服务

71+阅读 · 2021年7月31日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【AAAI2020】实体关系联合抽取的编码器-解码器结构的有效建模（ Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extraction）

【AAAI2020】实体关系联合抽取的编码器-解码器结构的有效建模（ Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extraction）

专知会员服务

53+阅读 · 2019年11月22日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型时代的文档智能：综述

蜂窝通信是否是无人机与无人地面战车主宰战场的关键？

文档视觉问答简述

最新新Agent综述！76页327篇论文梳理，北交大桑基韬教授团队发布《迈向模型原生智能体式人工智能的范式转变综述》

相关资讯

P-tuning v2: 提示微调方法可在跨规模和任务上与精调方法媲美 | 论文荐读

P-tuning v2: 提示微调方法可在跨规模和任务上与精调方法媲美 | 论文荐读

学术头条

2+阅读 · 2022年4月11日

信息抽取新SOTA！首个结构化生成式信息抽取预训练模型，一统信息抽取四大任务

信息抽取新SOTA！首个结构化生成式信息抽取预训练模型，一统信息抽取四大任务

PaperWeekly

7+阅读 · 2022年4月8日

有效且稳健的数据增强小样本学习 | 论文荐读

有效且稳健的数据增强小样本学习 | 论文荐读

学术头条

6+阅读 · 2022年3月25日

小样本自然语言理解的基准测试FewNLU | 论文荐读

小样本自然语言理解的基准测试FewNLU | 论文荐读

学术头条

1+阅读 · 2022年3月23日

基于自回归填空的通用语言模型预训练 | 论文荐读

基于自回归填空的通用语言模型预训练 | 论文荐读

学术头条

5+阅读 · 2022年3月14日

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知

0+阅读 · 2022年1月28日

论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

开放知识图谱

1+阅读 · 2021年11月11日

论文浅尝 | 将结构预测作为增广自然语言间的翻译任务

论文浅尝 | 将结构预测作为增广自然语言间的翻译任务

开放知识图谱

0+阅读 · 2021年9月1日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

相关基金

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

无监督分词及词性归纳联合方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

指挥控制任务共同体的机制和模型研究

国家自然科学基金

35+阅读 · 2013年12月31日

三维模型在异构空间中的语义迁移方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向海量数据语义标注众包的任务管理方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

科技论文的语义模式研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于词义的文档表示模型及多语亚文档主题分析研究

国家自然科学基金

0+阅读 · 2012年12月31日

文本语义模型和子空间聚类研究

国家自然科学基金

1+阅读 · 2009年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

面向查询的XML文本自动文摘研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Subset selection for linear mixed models

Arxiv

1+阅读 · 2022年4月18日

Transductive Learning for Abstractive News Summarization

Arxiv

0+阅读 · 2022年4月16日

Revisiting joint decoding based multi-talker speech recognition with DNN acoustic model

Revisiting joint decoding based multi-talker speech recognition with DNN acoustic model

Arxiv

0+阅读 · 2022年4月15日

ML_LTU at SemEval-2022 Task 4: T5 Towards Identifying Patronizing and Condescending Language

ML_LTU at SemEval-2022 Task 4: T5 Towards Identifying Patronizing and Condescending Language

Arxiv

0+阅读 · 2022年4月15日

Consecutive Decoding for Speech-to-text Translation

Arxiv

0+阅读 · 2022年4月15日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Reinforced Self-Attention Network: a Hybrid of Hard and Soft Attention for Sequence Modeling

Arxiv

16+阅读 · 2018年1月31日

A Structured Self-attentive Sentence Embedding

Arxiv

24+阅读 · 2017年3月9日

大家都在搜

2025最新文献

NTU博士论文

国防科技创新

精排模型-从MLP到行为序列：DIN、DIEN、MIMN、SIM、DSIN

微信扫码咨询专知VIP会员