https://www.zhuanzhi.ai/paper/fd7ce9fc6cc2c0d5867e2906d17e3d61

作为搜索引擎的心脏,排名系统在满足用户的信息需求方面起着至关重要的作用。最近,从预训练语言模型 (PLM) 微调的神经排名器建立了最先进的排名有效性。然而,由于以下具有挑战性的问题,将这些基于 PLM 的排名器直接应用于大规模网络搜索系统并非易事:(1)大规模神经 PLM 的计算成本过高,尤其是对于网络文档中的长文本,禁止将它们部署在需要极低延迟的在线排名系统中;(2) 现有排名不可知的预训练目标与需要全面相关性建模的临时检索场景之间的差异是改进在线排名系统的另一个主要障碍;(3) 现实世界的搜索引擎通常涉及排名组件的委员会,因此单独微调排名模型的兼容性对于合作排名系统至关重要。在这项工作中,我们在在线搜索引擎系统中部署最先进的中文预训练语言模型(即 ERNIE)时,贡献了一系列成功应用的技术来解决这些暴露的问题。我们首先阐明了一种新颖的做法,以经济高效地总结 Web 文档,并使用廉价但功能强大的 Pyramid-ERNIE 架构将结果摘要内容与查询语境化。然后我们赋予一个创新范式来精细地利用大规模的嘈杂和有偏见的点击后行为数据进行面向相关的预训练。我们还提出了一种为在线排名系统量身定制的人工锚定微调策略,旨在稳定各种在线组件的排名信号。大量的离线和在线实验结果表明,所提出的技术显着提高了搜索引擎的性能。

成为VIP会员查看完整内容
15

相关内容

近年来,预训练模型(例如ELMo、GPT、BERT和XLNet等)的快速发展大幅提升了诸多NLP任务的整体水平,同时也使得很多应用场景进入到实际落地阶段。预训练语言模型本身就是神经网络语言模型,它的特点包括:第一,可以使用大规模无标注纯文本语料进行训练;第二,可以用于各类下游NLP任务,不是针对某项定制的,但以后可用在下游NIP任务上,你不需要为下游任务专门设计一种神经网络,或者提供一种结构,直接在几种给定的固定框架中选择一种进行 fine-tune,就可以从而得到很好的结果。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
16+阅读 · 2021年8月24日
专知会员服务
15+阅读 · 2021年8月13日
专知会员服务
12+阅读 · 2021年5月29日
【WWW2021】基于图神经网络的社交好友排序
专知会员服务
48+阅读 · 2021年2月3日
最新《弱监督预训练语言模型微调》报告,52页ppt
专知会员服务
37+阅读 · 2020年12月26日
nlp中的实体关系抽取方法总结
深度学习自然语言处理
22+阅读 · 2020年7月4日
Transformer 在美团搜索排序中的实践
AINLP
3+阅读 · 2020年4月17日
达观数据技术干货 | 搜你所想”之用户搜索意图识别
数据挖掘入门与实战
4+阅读 · 2017年6月30日
美团点评旅游搜索召回策略的演进
美团技术团队
4+阅读 · 2017年6月16日
Arxiv
17+阅读 · 2021年3月29日
Arxiv
31+阅读 · 2020年9月21日
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Arxiv
3+阅读 · 2019年3月1日
Deep Graph Infomax
Arxiv
17+阅读 · 2018年12月21日
VIP会员
相关VIP内容
专知会员服务
16+阅读 · 2021年8月24日
专知会员服务
15+阅读 · 2021年8月13日
专知会员服务
12+阅读 · 2021年5月29日
【WWW2021】基于图神经网络的社交好友排序
专知会员服务
48+阅读 · 2021年2月3日
最新《弱监督预训练语言模型微调》报告,52页ppt
专知会员服务
37+阅读 · 2020年12月26日
相关论文
Arxiv
17+阅读 · 2021年3月29日
Arxiv
31+阅读 · 2020年9月21日
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Arxiv
3+阅读 · 2019年3月1日
Deep Graph Infomax
Arxiv
17+阅读 · 2018年12月21日
微信扫码咨询专知VIP会员