In various natural language processing tasks, passage retrieval and passage re-ranking are two key procedures in finding and ranking relevant information. Since both the two procedures contribute to the final performance, it is important to jointly optimize them in order to achieve mutual improvement. In this paper, we propose a novel joint training approach for dense passage retrieval and passage re-ranking. A major contribution is that we introduce the dynamic listwise distillation, where we design a unified listwise training approach for both the retriever and the re-ranker. During the dynamic distillation, the retriever and the re-ranker can be adaptively improved according to each other's relevance information. We also propose a hybrid data augmentation strategy to construct diverse training instances for listwise training approach. Extensive experiments show the effectiveness of our approach on both MSMARCO and Natural Questions datasets. Our code is available at https://github.com/PaddlePaddle/RocketQA.


翻译:在各种自然语言处理任务中,通过检索和通过重新排位是查找和排序相关信息的两个关键程序。由于这两种程序都有助于最后的绩效,因此必须共同优化它们,以便实现相互改进。在本文件中,我们提议对密集通道检索和通过重新排位采用新的联合培训方法。一个主要贡献是我们采用动态清单蒸馏方法,为检索者和重新排位者设计统一的清单培训方法。在动态蒸馏过程中,检索器和重新排位器可根据彼此的相关信息进行适应性改进。我们还提议了一项混合数据增强战略,为列表化培训方法构建多种培训实例。广泛的实验表明我们在MSMARCO和自然问题数据集方面的做法的有效性。我们的代码可在https://github.com/PaddlePaddle/RockeQA查阅。

4
下载
关闭预览

相关内容

iOS 8 提供的应用间和应用跟系统的功能交互特性。
  • Today (iOS and OS X): widgets for the Today view of Notification Center
  • Share (iOS and OS X): post content to web services or share content with others
  • Actions (iOS and OS X): app extensions to view or manipulate inside another app
  • Photo Editing (iOS): edit a photo or video in Apple's Photos app with extensions from a third-party apps
  • Finder Sync (OS X): remote file storage in the Finder with support for Finder content annotation
  • Storage Provider (iOS): an interface between files inside an app and other apps on a user's device
  • Custom Keyboard (iOS): system-wide alternative keyboards

Source: iOS 8 Extensions: Apple’s Plan for a Powerful App Ecosystem
专知会员服务
88+阅读 · 2021年6月29日
专知会员服务
54+阅读 · 2021年2月2日
专知会员服务
193+阅读 · 2020年10月14日
【Google】监督对比学习,Supervised Contrastive Learning
专知会员服务
74+阅读 · 2020年4月24日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
聊天机器人资料汇总
我爱机器学习
29+阅读 · 2016年12月14日
Arxiv
3+阅读 · 2019年8月19日
Arxiv
3+阅读 · 2019年3月1日
Arxiv
4+阅读 · 2019年2月18日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员