【WSDM 2021】面向信息检索的预训练语言模型 - 专知VIP

会员服务 ·

4

信息检索 · 预训练语言模型 ·

2020 年 11 月 29 日

【WSDM 2021】面向信息检索的预训练语言模型

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在大规模无标签文本上预训练语言模型，然后在下游任务微调的学习模式已经在自然语言处理（NLP）领域取得了广泛的应用。尽管当前的预训练语言模型在大部分NLP任务上取得了显著的进展，然而，研究人员发现当预训练任务的目标更接近于下游任务的目标时，模型在下游任务上能取得更大幅度的性能提升，例如针对文本摘要设计的Gap Sentence Prediciton预训练任务[1]、面向机器阅读理解设计的Span Selection预训练任务[2]、以及为情感分析设计的Label-aware MLM预训练任务[3]，都取得了相较于原始预训练语言模型更好的性能。近年来，在信息检索（IR）中，预训练语言模型在文档排序任务上取得了一定的效果，然而，如何设计更符合信息检索需求的预训练目标，是一个值得探索的新领域。

在这项工作中，我们提出了一个新颖的针对信息检索的预训练任务，叫做“代表词预测”任务（Representative Words Prediction）。这个任务是受到了IR中经典统计语言模型——查询似然模型的启发，在查询似然模型的基本假设中，查询被认为是由“理想”文档“生成”出来的具有代表性的文本，因此通过贝叶斯定理推导，查询的相关性强度可由其代表性或者说是其似然值表征。鉴于此，我们就构建了这样一个新的代表词预测任务（简称为ROP任务），具体来说，对于一个给定的文档，我们根据文档语言模型（狄利克雷平滑的多项式语言模型）采样出该文档的代表性词集，然后预训练语言模型使其能够有效地区分出其中哪些词项更具有代表性。为了同时建模查询和文档内容理解以及二者关系的预测，我们结合ROP与MLM一起在无标签的文档语料上进行预训练，我们把通过这种预训练方式得到的语言模型命名为PROP。

https://www.zhuanzhi.ai/paper/57435651043bb840be881c8e7a71c70d

成为VIP会员查看完整内容

36

相关内容

信息检索

信息检索( Information Retrieval )指信息按一定的方式组织起来，并根据信息用户的需要找出有关的信息的过程和技术。信息检索的目标：准确、及时、全面的获取所需信息。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【WSDM2021】弱监督下的分层元数据感知文档分类

【WSDM2021】弱监督下的分层元数据感知文档分类

专知会员服务

11+阅读 · 2020年11月16日

彭博新书《知识图谱: 一种信息检索视角》，159页pdf

彭博新书《知识图谱: 一种信息检索视角》，159页pdf

专知会员服务

151+阅读 · 2020年11月1日

最新《知识图谱表示学习补全》综述论文，16页pdf

最新《知识图谱表示学习补全》综述论文，16页pdf

专知会员服务

68+阅读 · 2020年10月29日

【COLING2020】无监督依存解析的综述论文，12页pdf

【COLING2020】无监督依存解析的综述论文，12页pdf

专知会员服务

16+阅读 · 2020年10月27日

五篇 CIKM2020【信息检索 +推荐】相关论文，人大高瓴人工智能学院

五篇 CIKM2020【信息检索 +推荐】相关论文，人大高瓴人工智能学院

专知会员服务

48+阅读 · 2020年8月20日

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

专知会员服务

63+阅读 · 2020年8月19日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

【北航】面向自然语言处理的预训练技术研究综述

【北航】面向自然语言处理的预训练技术研究综述

专知会员服务

114+阅读 · 2020年4月23日

【清华大学博士论文】面向社会计算的网络表示学习，涂存超

【清华大学博士论文】面向社会计算的网络表示学习，涂存超

专知会员服务

76+阅读 · 2019年11月7日

ICML2020 图神经网络的预训练

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

THUIR师生论文获WSDM 2020录用

THUIR师生论文获WSDM 2020录用

THUIR

8+阅读 · 2019年10月11日

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

开放知识图谱

16+阅读 · 2019年8月17日

论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型

论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型

开放知识图谱

31+阅读 · 2019年4月7日

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

PaperWeekly

17+阅读 · 2018年12月5日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

深度上下文词向量

深度上下文词向量

微信AI

27+阅读 · 2018年9月13日

赛尔原创 | IJCAI 2018 利用跨语言知识改进稀缺资源语言命名实体识别

赛尔原创 | IJCAI 2018 利用跨语言知识改进稀缺资源语言命名实体识别

哈工大SCIR

7+阅读 · 2018年5月21日

赛尔推荐 | 第3期

赛尔推荐 | 第3期

哈工大SCIR

7+阅读 · 2018年3月28日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Few-shot Natural Language Generation for Task-Oriented Dialog

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

Language Models as Knowledge Bases?

Arxiv

6+阅读 · 2019年9月4日

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

Arxiv

4+阅读 · 2018年6月25日

Metric for Automatic Machine Translation Evaluation based on Universal Sentence Representations

Arxiv

4+阅读 · 2018年5月18日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

Knowledge-based Word Sense Disambiguation using Topic Models

Arxiv

5+阅读 · 2018年1月5日

Multilingual Topic Models

Arxiv

3+阅读 · 2017年12月18日

VIP会员

相关主题

预训练语言模型

相关VIP内容

【WSDM2021】弱监督下的分层元数据感知文档分类

【WSDM2021】弱监督下的分层元数据感知文档分类

专知会员服务

11+阅读 · 2020年11月16日

彭博新书《知识图谱: 一种信息检索视角》，159页pdf

彭博新书《知识图谱: 一种信息检索视角》，159页pdf

专知会员服务

151+阅读 · 2020年11月1日

最新《知识图谱表示学习补全》综述论文，16页pdf

最新《知识图谱表示学习补全》综述论文，16页pdf

专知会员服务

68+阅读 · 2020年10月29日

【COLING2020】无监督依存解析的综述论文，12页pdf

【COLING2020】无监督依存解析的综述论文，12页pdf

专知会员服务

16+阅读 · 2020年10月27日

五篇 CIKM2020【信息检索 +推荐】相关论文，人大高瓴人工智能学院

五篇 CIKM2020【信息检索 +推荐】相关论文，人大高瓴人工智能学院

专知会员服务

48+阅读 · 2020年8月20日

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

专知会员服务

63+阅读 · 2020年8月19日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

【北航】面向自然语言处理的预训练技术研究综述

【北航】面向自然语言处理的预训练技术研究综述

专知会员服务

114+阅读 · 2020年4月23日

【清华大学博士论文】面向社会计算的网络表示学习，涂存超

【清华大学博士论文】面向社会计算的网络表示学习，涂存超

专知会员服务

76+阅读 · 2019年11月7日

热门VIP内容

开通专知VIP会员享更多权益服务

模型提取攻击与防御的系统综述：最新进展与展望

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

【CMU博士论文】用于物理模拟的高效深度学习模型

大模型解决方案白皮书：社交陪伴场景全流程落地指南

相关资讯

ICML2020 图神经网络的预训练

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

THUIR师生论文获WSDM 2020录用

THUIR师生论文获WSDM 2020录用

THUIR

8+阅读 · 2019年10月11日

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

论文浅尝 | 利用关系标签的主题语义知识为关系抽取提供监督 (IJCAI 2019)

开放知识图谱

16+阅读 · 2019年8月17日

论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型

论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型

开放知识图谱

31+阅读 · 2019年4月7日

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

PaperWeekly

17+阅读 · 2018年12月5日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

深度上下文词向量

深度上下文词向量

微信AI

27+阅读 · 2018年9月13日

赛尔原创 | IJCAI 2018 利用跨语言知识改进稀缺资源语言命名实体识别

赛尔原创 | IJCAI 2018 利用跨语言知识改进稀缺资源语言命名实体识别

哈工大SCIR

7+阅读 · 2018年5月21日

赛尔推荐 | 第3期

赛尔推荐 | 第3期

哈工大SCIR

7+阅读 · 2018年3月28日

相关论文

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Few-shot Natural Language Generation for Task-Oriented Dialog

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

Language Models as Knowledge Bases?

Arxiv

6+阅读 · 2019年9月4日

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

Arxiv

4+阅读 · 2018年6月25日

Metric for Automatic Machine Translation Evaluation based on Universal Sentence Representations

Arxiv

4+阅读 · 2018年5月18日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

Knowledge-based Word Sense Disambiguation using Topic Models

Arxiv

5+阅读 · 2018年1月5日

Multilingual Topic Models

Arxiv

3+阅读 · 2017年12月18日

微信扫码咨询专知VIP会员