【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

2020 年 8 月 28 日 专知


搜索引擎已经成为各种web和移动应用程序的基本组件。从海量数据集中检索相关文档对于搜索引擎系统来说是一项挑战,尤其是在遇到冗长或尾部查询时。在本文中,我们探索了一个向量空间搜索框架的文档检索。具体地说,我们训练了一个深度语义匹配模型,使每个查询和文档都可以编码为低维嵌入。我们的模型是基于BERT架构进行训练的。我们为在线服务部署了一个快速的k-近邻索引服务。离线和在线指标都表明,我们的方法大大提高了检索性能和搜索质量,特别是尾部查询。


https://www.zhuanzhi.ai/paper/98c122f66125ade0ad73761f23bab2f4


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“RFTS” 可以获取《【知乎】超越Lexical:用于文本搜索引擎的语义检索框架》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
9

相关内容

【ICML2020-浙江大学】对抗性互信息的文本生成
专知会员服务
43+阅读 · 2020年7月4日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【KDD2020】动态知识图谱的多事件预测
专知
88+阅读 · 2020年8月31日
【KDD2020-阿里】可调控的多兴趣推荐框架
专知
9+阅读 · 2020年8月11日
基于深度学习的文本生成【附217页PPT下载】
专知
35+阅读 · 2018年11月24日
Arxiv
12+阅读 · 2020年6月20日
Neural Module Networks for Reasoning over Text
Arxiv
9+阅读 · 2019年12月10日
Arxiv
8+阅读 · 2019年3月21日
Learning to Focus when Ranking Answers
Arxiv
5+阅读 · 2018年8月8日
VIP会员
Top
微信扫码咨询专知VIP会员