搜索引擎已经成为各种web和移动应用程序的基本组件。从海量数据集中检索相关文档对于搜索引擎系统来说是一项挑战,尤其是在遇到冗长或尾部查询时。在本文中,我们探索了一个向量空间搜索框架的文档检索。具体地说,我们训练了一个深度语义匹配模型,使每个查询和文档都可以编码为低维嵌入。我们的模型是基于BERT架构进行训练的。我们为在线服务部署了一个快速的k-近邻索引服务。离线和在线指标都表明,我们的方法大大提高了检索性能和搜索质量,特别是尾部查询。
https://www.zhuanzhi.ai/paper/98c122f66125ade0ad73761f23bab2f4
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“RFTS” 可以获取《【知乎】超越Lexical:用于文本搜索引擎的语义检索框架》专知下载链接索引