【KDD2021】基于预训练语言模型的百度搜索排序 - 专知VIP

会员服务 ·

2

预训练语言模型 · 百度 · 搜索排序 ·

2021 年 8 月 19 日

【KDD2021】基于预训练语言模型的百度搜索排序

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

https://www.zhuanzhi.ai/paper/fd7ce9fc6cc2c0d5867e2906d17e3d61

作为搜索引擎的心脏，排名系统在满足用户的信息需求方面起着至关重要的作用。最近，从预训练语言模型 (PLM) 微调的神经排名器建立了最先进的排名有效性。然而，由于以下具有挑战性的问题，将这些基于 PLM 的排名器直接应用于大规模网络搜索系统并非易事：（1）大规模神经 PLM 的计算成本过高，尤其是对于网络文档中的长文本，禁止将它们部署在需要极低延迟的在线排名系统中；(2) 现有排名不可知的预训练目标与需要全面相关性建模的临时检索场景之间的差异是改进在线排名系统的另一个主要障碍;(3) 现实世界的搜索引擎通常涉及排名组件的委员会，因此单独微调排名模型的兼容性对于合作排名系统至关重要。在这项工作中，我们在在线搜索引擎系统中部署最先进的中文预训练语言模型（即 ERNIE）时，贡献了一系列成功应用的技术来解决这些暴露的问题。我们首先阐明了一种新颖的做法，以经济高效地总结 Web 文档，并使用廉价但功能强大的 Pyramid-ERNIE 架构将结果摘要内容与查询语境化。然后我们赋予一个创新范式来精细地利用大规模的嘈杂和有偏见的点击后行为数据进行面向相关的预训练。我们还提出了一种为在线排名系统量身定制的人工锚定微调策略，旨在稳定各种在线组件的排名信号。大量的离线和在线实验结果表明，所提出的技术显着提高了搜索引擎的性能。

成为VIP会员查看完整内容

16

相关内容

预训练语言模型

预训练语言模型

近年来，预训练模型（例如ELMo、GPT、BERT和XLNet等）的快速发展大幅提升了诸多NLP任务的整体水平，同时也使得很多应用场景进入到实际落地阶段。预训练语言模型本身就是神经网络语言模型，它的特点包括：第一，可以使用大规模无标注纯文本语料进行训练；第二，可以用于各类下游NLP任务，不是针对某项定制的，但以后可用在下游NIP任务上，你不需要为下游任务专门设计一种神经网络，或者提供一种结构，直接在几种给定的固定框架中选择一种进行 fine-tune，就可以从而得到很好的结果。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CIKM2021】用户行为序列对比学习的上下文感知文档排序

专知会员服务

20+阅读 · 2021年8月30日

【CIKM2021】超链接预训练信息检索

专知会员服务

17+阅读 · 2021年8月24日

【KDD2021】检索交互机的表格数据预测

专知会员服务

16+阅读 · 2021年8月13日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

【KDD2021】自监督表示集成的新冠咳嗽分类

专知会员服务

13+阅读 · 2021年5月29日

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

专知会员服务

69+阅读 · 2021年3月18日

【WWW2021】基于图神经网络的社交好友排序

【WWW2021】基于图神经网络的社交好友排序

专知会员服务

50+阅读 · 2021年2月3日

最新《弱监督预训练语言模型微调》报告，52页ppt

最新《弱监督预训练语言模型微调》报告，52页ppt

专知会员服务

38+阅读 · 2020年12月26日

【SIGIR2020-斯坦福大学】一种新的又好又快的BERT类信息检索模型-ColBERT

【SIGIR2020-斯坦福大学】一种新的又好又快的BERT类信息检索模型-ColBERT

专知会员服务

44+阅读 · 2020年4月28日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

【博士论文】搜索引擎中的实体推荐关键技术研究

【博士论文】搜索引擎中的实体推荐关键技术研究

专知

13+阅读 · 2020年12月9日

nlp中的实体关系抽取方法总结

nlp中的实体关系抽取方法总结

深度学习自然语言处理

22+阅读 · 2020年7月4日

【深度语义匹配模型】实践篇：语义匹配在贝壳找房智能客服中的应用

【深度语义匹配模型】实践篇：语义匹配在贝壳找房智能客服中的应用

AINLP

6+阅读 · 2020年5月23日

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

专知

15+阅读 · 2020年4月28日

Transformer 在美团搜索排序中的实践

Transformer 在美团搜索排序中的实践

AINLP

3+阅读 · 2020年4月17日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

专知

23+阅读 · 2019年12月8日

【QA论文笔记】问答对排序新方法，层次循环编码器与主题聚类结合

【QA论文笔记】问答对排序新方法，层次循环编码器与主题聚类结合

专知

9+阅读 · 2018年5月14日

达观数据技术干货 | 搜你所想”之用户搜索意图识别

达观数据技术干货 | 搜你所想”之用户搜索意图识别

数据挖掘入门与实战

5+阅读 · 2017年6月30日

美团点评旅游搜索召回策略的演进

美团点评旅游搜索召回策略的演进

美团技术团队

4+阅读 · 2017年6月16日

zk-Fabric, a Polylithic Syntax Zero Knowledge Joint Proof System

zk-Fabric, a Polylithic Syntax Zero Knowledge Joint Proof System

Arxiv

0+阅读 · 2021年10月14日

P-Adapters: Robustly Extracting Factual Information from Language Models with Diverse Prompts

Arxiv

1+阅读 · 2021年10月14日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Heterogeneous Deep Graph Infomax

Heterogeneous Deep Graph Infomax

Arxiv

12+阅读 · 2019年11月19日

Mesh R-CNN

Arxiv

4+阅读 · 2019年6月6日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

Deep Graph Infomax

Deep Graph Infomax

Arxiv

17+阅读 · 2018年12月21日

The Web as a Knowledge-base for Answering Complex Questions

Arxiv

5+阅读 · 2018年3月18日

SQL-Rank: A Listwise Approach to Collaborative Ranking

Arxiv

6+阅读 · 2018年2月28日

VIP会员

相关主题

预训练语言模型

相关VIP内容

【CIKM2021】用户行为序列对比学习的上下文感知文档排序

专知会员服务

20+阅读 · 2021年8月30日

【CIKM2021】超链接预训练信息检索

专知会员服务

17+阅读 · 2021年8月24日

【KDD2021】检索交互机的表格数据预测

专知会员服务

16+阅读 · 2021年8月13日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

【KDD2021】自监督表示集成的新冠咳嗽分类

专知会员服务

13+阅读 · 2021年5月29日

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

专知会员服务

69+阅读 · 2021年3月18日

【WWW2021】基于图神经网络的社交好友排序

【WWW2021】基于图神经网络的社交好友排序

专知会员服务

50+阅读 · 2021年2月3日

最新《弱监督预训练语言模型微调》报告，52页ppt

最新《弱监督预训练语言模型微调》报告，52页ppt

专知会员服务

38+阅读 · 2020年12月26日

【SIGIR2020-斯坦福大学】一种新的又好又快的BERT类信息检索模型-ColBERT

【SIGIR2020-斯坦福大学】一种新的又好又快的BERT类信息检索模型-ColBERT

专知会员服务

44+阅读 · 2020年4月28日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关资讯

【博士论文】搜索引擎中的实体推荐关键技术研究

【博士论文】搜索引擎中的实体推荐关键技术研究

专知

13+阅读 · 2020年12月9日

nlp中的实体关系抽取方法总结

nlp中的实体关系抽取方法总结

深度学习自然语言处理

22+阅读 · 2020年7月4日

【深度语义匹配模型】实践篇：语义匹配在贝壳找房智能客服中的应用

【深度语义匹配模型】实践篇：语义匹配在贝壳找房智能客服中的应用

AINLP

6+阅读 · 2020年5月23日

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

专知

15+阅读 · 2020年4月28日

Transformer 在美团搜索排序中的实践

Transformer 在美团搜索排序中的实践

AINLP

3+阅读 · 2020年4月17日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

专知

23+阅读 · 2019年12月8日

【QA论文笔记】问答对排序新方法，层次循环编码器与主题聚类结合

【QA论文笔记】问答对排序新方法，层次循环编码器与主题聚类结合

专知

9+阅读 · 2018年5月14日

达观数据技术干货 | 搜你所想”之用户搜索意图识别

达观数据技术干货 | 搜你所想”之用户搜索意图识别

数据挖掘入门与实战

5+阅读 · 2017年6月30日

美团点评旅游搜索召回策略的演进

美团点评旅游搜索召回策略的演进

美团技术团队

4+阅读 · 2017年6月16日

相关论文

zk-Fabric, a Polylithic Syntax Zero Knowledge Joint Proof System

zk-Fabric, a Polylithic Syntax Zero Knowledge Joint Proof System

Arxiv

0+阅读 · 2021年10月14日

P-Adapters: Robustly Extracting Factual Information from Language Models with Diverse Prompts

Arxiv

1+阅读 · 2021年10月14日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Heterogeneous Deep Graph Infomax

Heterogeneous Deep Graph Infomax

Arxiv

12+阅读 · 2019年11月19日

Mesh R-CNN

Arxiv

4+阅读 · 2019年6月6日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

Deep Graph Infomax

Deep Graph Infomax

Arxiv

17+阅读 · 2018年12月21日

The Web as a Knowledge-base for Answering Complex Questions

Arxiv

5+阅读 · 2018年3月18日

SQL-Rank: A Listwise Approach to Collaborative Ranking

Arxiv

6+阅读 · 2018年2月28日

微信扫码咨询专知VIP会员