语义向量检索入门教程(非恰饭贴)

2022 年 6 月 11 日 夕小瑶的卖萌屋

文 | 夕小瑶

近几年,基于预训练模型的深度文本匹配技术为信息检索领域带来了一波技术红利爆发期。

技术红利主要体现在两方面:

  1. 基于BERT交互式结构的文本匹配改善了搜索业务精排阶段的性能
  2. 基于BERT双塔结构的文本匹配改善了搜索业务召回阶段的性能

而在搜索的召回阶段,与双塔模型结合使用的便是语义向量检索技术,前者负责为query和doc预测向量,后者完成向量的大规模检索(1 query vs 亿级 doc)。

关于双塔模型方面的技术资料很多,但语义向量检索方面的资料却很稀少。

本文给大家推荐一个这方面的国外免费教程(非恰饭),不仅有清晰的理论讲解,而且有配套的代码实践。希望可以帮助到对这方面感兴趣的小伙伴。

课程传送门:

www.pinecone.io/learn

课程大纲(实际内容比这个多很多):

  • Part 1: Introduction

    • Semantic Search: Measuring Meaning From Jaccard to Bert
    • Getting Started with Faiss
    • Nearest Neighbor Indexes for Similarity Search
  • Part 2: Algorithm Deep Dives

    • Traditional Locality Sensitive Hashing (LSH)
    • Random Projection for LSH
    • Compression with Product Quantization
    • Hierarchical Navigable Small Worlds (HNSW) Graphs
  • Part 3: More Advanced Index Concepts

    • Filtering: The Missing WHERE Clause in Vector Search
    • Composite Indexes: Facebook AI and the Index Factory

为了方便学习交流,结识更多小伙伴,小夕还建了一个语义向量检索技术交流群,感兴趣的小伙伴在公众号后台回复"入群"噢。

后台回复关键词【入群

加入卖萌屋NLP、CV与搜推广与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

登录查看更多
0

相关内容

专知会员服务
27+阅读 · 2021年7月20日
专知会员服务
26+阅读 · 2021年4月22日
最新《Transformers模型》教程,64页ppt
专知会员服务
309+阅读 · 2020年11月26日
专知会员服务
314+阅读 · 2020年11月24日
迁移学习简明教程,11页ppt
专知会员服务
107+阅读 · 2020年8月4日
一份简单《图神经网络》教程,28页ppt
专知会员服务
123+阅读 · 2020年8月2日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
【千字长文】入门到入土,NLP学习全路径推荐
图与推荐
0+阅读 · 2022年7月4日
入门NLP必读的10篇baseline论文
机器学习与推荐算法
0+阅读 · 2022年3月17日
基于深度学习的文本生成【附217页PPT下载】
专知
35+阅读 · 2018年11月24日
【泡泡机器人】一文带你入门语义SLAM
泡泡机器人SLAM
29+阅读 · 2017年11月29日
深度学习的中文资源,教程推荐!
机器学习研究会
19+阅读 · 2017年11月28日
自然语言处理 (NLP)资源大全
机械鸡
35+阅读 · 2017年9月17日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
17+阅读 · 2021年3月29日
VIP会员
相关VIP内容
专知会员服务
27+阅读 · 2021年7月20日
专知会员服务
26+阅读 · 2021年4月22日
最新《Transformers模型》教程,64页ppt
专知会员服务
309+阅读 · 2020年11月26日
专知会员服务
314+阅读 · 2020年11月24日
迁移学习简明教程,11页ppt
专知会员服务
107+阅读 · 2020年8月4日
一份简单《图神经网络》教程,28页ppt
专知会员服务
123+阅读 · 2020年8月2日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
相关资讯
【千字长文】入门到入土,NLP学习全路径推荐
图与推荐
0+阅读 · 2022年7月4日
入门NLP必读的10篇baseline论文
机器学习与推荐算法
0+阅读 · 2022年3月17日
基于深度学习的文本生成【附217页PPT下载】
专知
35+阅读 · 2018年11月24日
【泡泡机器人】一文带你入门语义SLAM
泡泡机器人SLAM
29+阅读 · 2017年11月29日
深度学习的中文资源,教程推荐!
机器学习研究会
19+阅读 · 2017年11月28日
自然语言处理 (NLP)资源大全
机械鸡
35+阅读 · 2017年9月17日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员