【2020新书】预训练Transformer模型的文本排序 - 专知VIP

会员服务 ·

4

文本排序 · Transformer · BERT · 自然语言处理 ·

2020 年 10 月 18 日

【2020新书】预训练Transformer模型的文本排序

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

介绍

文本排序的目标是生成一个有序的文本列表，这些文本从语料库中检索，以响应针对特定任务的查询。虽然最常见的文本排序是搜索，但是在许多自然语言处理应用程序中也可以找到该任务的实例。本书提供了一个关于文本排序与被称为transformer的神经网络结构的概述，其中BERT是最著名的例子。毫不夸张地说，transformer和自我监督预训练的结合已经彻底改变了自然语言处理(NLP)、信息检索(IR)等领域。在文本排序的上下文中，这些模型跨许多领域、任务和设置产生高质量的结果。

在这本书中，我们为希望更好地理解如何将transformer应用到文本排序问题的从业者和希望从事这一领域工作的研究人员提供了现有工作的综合。我们涵盖了广泛的现代技术，分为两个高级类别:transformer模型，在多阶段排序架构中执行重新排序，以及学习了试图直接执行排序的密集表示。有许多属于第一类的例子，包括基于相关性分类、从文本的多个部分收集证据、语料库分析和序列到序列模型的方法。虽然第二类方法还没有得到很好的研究，但使用transformer的表示学习是一个新兴的、令人兴奋的方向，必将吸引更多的关注。在我们的书中有两个主题:处理长文档的技术(超出了NLP中使用的典型逐句处理方法)和处理效率(结果质量)和效率(查询延迟)之间权衡的技术。

尽管transformer架构和预训练技术是最近的创新，但它们如何应用于文本排序的许多方面已经得到了相对较好的理解，并代表了成熟的技术。然而，还有许多有待解决的研究问题，因此，除了为预先训练的transformer文本排序奠定基础外，本书还试图预测该领域的发展方向。

目录

部分内容概览

成为VIP会员查看完整内容

63

相关内容

文本排序

【经典书】计算语言学：模型、资源的应用程序，198页pdf

【经典书】计算语言学：模型、资源的应用程序，198页pdf

专知会员服务

32+阅读 · 2020年11月19日

【2020新书】Google软件工程方法论，617页pdf

【2020新书】Google软件工程方法论，617页pdf

专知会员服务

82+阅读 · 2020年11月11日

滑铁卢大学新书《基于预训练Transformer模型的文本排序》，204页pdf

滑铁卢大学新书《基于预训练Transformer模型的文本排序》，204页pdf

专知会员服务

44+阅读 · 2020年10月18日

【2020新书】使用R和Python的高级BI分析，425页pdf

【2020新书】使用R和Python的高级BI分析，425页pdf

专知会员服务

35+阅读 · 2020年10月14日

【2020新书】数据结构与数据表示指南，112页pdf

【2020新书】数据结构与数据表示指南，112页pdf

专知会员服务

84+阅读 · 2020年10月6日

【新书】自然语言处理表示学习技术，349页pdf，清华大学

【新书】自然语言处理表示学习技术，349页pdf，清华大学

专知会员服务

174+阅读 · 2020年7月11日

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

专知会员服务

107+阅读 · 2020年7月9日

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

专知会员服务

189+阅读 · 2020年4月4日

【2020新书】使用Google Dialogflow构建虚拟助手对话机器人，201页pdf

【2020新书】使用Google Dialogflow构建虚拟助手对话机器人，201页pdf

专知会员服务

72+阅读 · 2020年3月19日

注意力机制模型最新综述

注意力机制模型最新综述

专知会员服务

270+阅读 · 2019年10月20日

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

专知

23+阅读 · 2020年4月4日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知

67+阅读 · 2019年9月26日

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

雷锋网

5+阅读 · 2019年6月20日

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

AI科技评论

6+阅读 · 2019年6月20日

Attention！注意力机制模型最新综述（附下载）

Attention！注意力机制模型最新综述（附下载）

数据派THU

36+阅读 · 2019年4月14日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

专知

65+阅读 · 2019年4月8日

新书速递-《自动化机器学习：方法，系统和挑战》-免费下载

新书速递-《自动化机器学习：方法，系统和挑战》-免费下载

深度学习与NLP

20+阅读 · 2019年3月26日

3分钟看懂史上最强NLP模型BERT

3分钟看懂史上最强NLP模型BERT

新智元

23+阅读 · 2019年2月27日

图解2018年领先的两大NLP模型：BERT和ELMo

图解2018年领先的两大NLP模型：BERT和ELMo

新智元

9+阅读 · 2018年12月14日

CL-IMS @ DIACR-Ita: Volente o Nolente: BERT does not outperform SGNS on Semantic Change Detection

Arxiv

0+阅读 · 2020年12月3日

End-to-End 3D Point Cloud Learning for Registration Task Using Virtual Correspondences

Arxiv

1+阅读 · 2020年11月30日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Inducing Relational Knowledge from BERT

Arxiv

3+阅读 · 2019年11月28日

Tutorial on NLP-Inspired Network Embedding

Tutorial on NLP-Inspired Network Embedding

Arxiv

7+阅读 · 2019年10月16日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

The Evolved Transformer

The Evolved Transformer

Arxiv

5+阅读 · 2019年1月30日

You May Not Need Attention

Arxiv

4+阅读 · 2018年10月31日

From direct tagging to Tagging with sentences compression

From direct tagging to Tagging with sentences compression

Arxiv

6+阅读 · 2018年10月5日

Neural Arithmetic Logic Units

Neural Arithmetic Logic Units

Arxiv

5+阅读 · 2018年8月1日

VIP会员

相关主题

自然语言处理

相关VIP内容

【经典书】计算语言学：模型、资源的应用程序，198页pdf

【经典书】计算语言学：模型、资源的应用程序，198页pdf

专知会员服务

32+阅读 · 2020年11月19日

【2020新书】Google软件工程方法论，617页pdf

【2020新书】Google软件工程方法论，617页pdf

专知会员服务

82+阅读 · 2020年11月11日

滑铁卢大学新书《基于预训练Transformer模型的文本排序》，204页pdf

滑铁卢大学新书《基于预训练Transformer模型的文本排序》，204页pdf

专知会员服务

44+阅读 · 2020年10月18日

【2020新书】使用R和Python的高级BI分析，425页pdf

【2020新书】使用R和Python的高级BI分析，425页pdf

专知会员服务

35+阅读 · 2020年10月14日

【2020新书】数据结构与数据表示指南，112页pdf

【2020新书】数据结构与数据表示指南，112页pdf

专知会员服务

84+阅读 · 2020年10月6日

【新书】自然语言处理表示学习技术，349页pdf，清华大学

【新书】自然语言处理表示学习技术，349页pdf，清华大学

专知会员服务

174+阅读 · 2020年7月11日

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

专知会员服务

107+阅读 · 2020年7月9日

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

专知会员服务

189+阅读 · 2020年4月4日

【2020新书】使用Google Dialogflow构建虚拟助手对话机器人，201页pdf

【2020新书】使用Google Dialogflow构建虚拟助手对话机器人，201页pdf

专知会员服务

72+阅读 · 2020年3月19日

注意力机制模型最新综述

注意力机制模型最新综述

专知会员服务

270+阅读 · 2019年10月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

专知

23+阅读 · 2020年4月4日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知

67+阅读 · 2019年9月26日

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

雷锋网

5+阅读 · 2019年6月20日

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

AI科技评论

6+阅读 · 2019年6月20日

Attention！注意力机制模型最新综述（附下载）

Attention！注意力机制模型最新综述（附下载）

数据派THU

36+阅读 · 2019年4月14日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

专知

65+阅读 · 2019年4月8日

新书速递-《自动化机器学习：方法，系统和挑战》-免费下载

新书速递-《自动化机器学习：方法，系统和挑战》-免费下载

深度学习与NLP

20+阅读 · 2019年3月26日

3分钟看懂史上最强NLP模型BERT

3分钟看懂史上最强NLP模型BERT

新智元

23+阅读 · 2019年2月27日

图解2018年领先的两大NLP模型：BERT和ELMo

图解2018年领先的两大NLP模型：BERT和ELMo

新智元

9+阅读 · 2018年12月14日

相关论文

CL-IMS @ DIACR-Ita: Volente o Nolente: BERT does not outperform SGNS on Semantic Change Detection

Arxiv

0+阅读 · 2020年12月3日

End-to-End 3D Point Cloud Learning for Registration Task Using Virtual Correspondences

Arxiv

1+阅读 · 2020年11月30日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Inducing Relational Knowledge from BERT

Arxiv

3+阅读 · 2019年11月28日

Tutorial on NLP-Inspired Network Embedding

Tutorial on NLP-Inspired Network Embedding

Arxiv

7+阅读 · 2019年10月16日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

The Evolved Transformer

The Evolved Transformer

Arxiv

5+阅读 · 2019年1月30日

You May Not Need Attention

Arxiv

4+阅读 · 2018年10月31日

From direct tagging to Tagging with sentences compression

From direct tagging to Tagging with sentences compression

Arxiv

6+阅读 · 2018年10月5日

Neural Arithmetic Logic Units

Neural Arithmetic Logic Units

Arxiv

5+阅读 · 2018年8月1日

微信扫码咨询专知VIP会员