CVPR 2023开会了！东京大学等最新《神经搜索实战》教程，附300多页ppt - 专知VIP

会员服务 ·

14

CVPR 2023 · 神经搜索 ·

2023 年 6 月 21 日

CVPR 2023开会了！东京大学等最新《神经搜索实战》教程，附300多页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

来自东京大学、哥本哈根信息技术大学、Jina AI给出了《神经搜索实战》教程，值得关注！

神经搜索，一种在深度嵌入空间中高效搜索相似项的技术，是处理大型多模态集合的最基本技术。随着基础模型和提示工程等强大技术的出现，高效的神经搜索变得越来越重要。例如，像CLIP这样的多模态编码器允许我们将各种问题转化为简单的嵌入和搜索。另一个例子是将信息输入到LLM中的方式；目前，向量搜索引擎是一个有前途的方向。尽管有上述关注，但如何为给定数据设计搜索算法并不明显。在这个教程中，我们将关注“百万规模搜索”、“十亿规模搜索”和“查询语言”，以展示如何解决现实世界的搜索问题：

首先，我们概述基于图的最近邻搜索方法的理论和应用。基于图的方法是当前内存（百万规模）搜索的事实标准，但由于其具有许多启发式方法的复杂结构，它们难以理解。我们将解释其基本的数学概念，总结最近的改进，并为选择算法提供实用的指南。本教程的第二部分将涵盖十亿规模近似最近邻搜索的当前方法和基准测试工作。它将扩展第一部分教程的讨论到这个规模，并概述一般的搜索流程和不同方法（基于图的/基于集群的/量化）的适用性。最后，它总结了有趣的研究方向。最后，我们将对神经搜索的查询语言进行概述，包括其语法、语义和应用。查询语言是神经搜索的一个关键方面，它允许用户以系统可以理解和执行的结构化和组成的方式表达他们的信息需求和约束。我们将讨论如何将查询语言与向量相似度搜索和BM25结合以提高信息检索性能。我们还将覆盖该领域的常见挑战和最近的发展，并为设计和实现神经搜索系统的查询语言提供指导。这个教程旨在面向对在他们的工作中使用神经搜索的查询语言感兴趣的研究者和实践者。

成为VIP会员查看完整内容

35

相关内容

CVPR 2023

CVPR 2023大会将于 6 月 18 日至 22 日在温哥华会议中心举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。 CVPR 2023 共收到 9155 份提交，比去年增加了 12%，创下新纪录，今年接收了 2360 篇论文，接收率为 25.78%。作为对比，去年有 8100 多篇有效投稿，大会接收了 2067 篇，接收率为 25%。

CVPR 2023开会了！UIUC等最新《知识驱动的视觉语言编码》教程，附ppt

CVPR 2023开会了！UIUC等最新《知识驱动的视觉语言编码》教程，附ppt

专知会员服务

34+阅读 · 2023年6月24日

电子科大最新《深度聚类》全面综述，20页pdf涵盖260篇文献全面阐述深度聚类方法

电子科大最新《深度聚类》全面综述，20页pdf涵盖260篇文献全面阐述深度聚类方法

专知会员服务

109+阅读 · 2022年10月16日

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

专知会员服务

111+阅读 · 2022年10月5日

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

专知会员服务

41+阅读 · 2022年9月19日

百度北京大学发布首篇《自然语言生成保真性》综述论文，52页pdf系统性阐述NLG分析、评价和优化方法

百度北京大学发布首篇《自然语言生成保真性》综述论文，52页pdf系统性阐述NLG分析、评价和优化方法

专知会员服务

28+阅读 · 2022年3月11日

符号还是神经？AAAI2022Mila唐建团队《知识图谱推理进展》教程，150页ppt全面讲解符号逻辑神经推理方法

符号还是神经？AAAI2022Mila唐建团队《知识图谱推理进展》教程，150页ppt全面讲解符号逻辑神经推理方法

专知会员服务

98+阅读 · 2022年2月25日

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

专知会员服务

132+阅读 · 2022年1月11日

【干货书-IBM推荐】机器学习傻瓜式入门，75页pdf

【干货书-IBM推荐】机器学习傻瓜式入门，75页pdf

专知会员服务

52+阅读 · 2020年9月29日

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

专知会员服务

157+阅读 · 2019年11月26日

【ICML 2019 | 元学习教程】伯克利Chelsea Finn、Sergey Levine主讲，附111PDF

【ICML 2019 | 元学习教程】伯克利Chelsea Finn、Sergey Levine主讲，附111PDF

专知会员服务

54+阅读 · 2019年11月12日

不可错过！CMU《结构化数据机器学习》课程，附Slides

不可错过！CMU《结构化数据机器学习》课程，附Slides

专知

0+阅读 · 2022年11月2日

电子科大最新《深度聚类》全面综述，20页pdf涵盖260篇文献全面阐述深度聚类方法

电子科大最新《深度聚类》全面综述，20页pdf涵盖260篇文献全面阐述深度聚类方法

专知

1+阅读 · 2022年10月16日

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

专知

3+阅读 · 2022年10月7日

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

专知

4+阅读 · 2022年10月5日

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

专知

0+阅读 · 2022年9月19日

什么是进化深度学习？东北大学等最新《进化深度学习:原理、算法、应用》综述，34页pdf阐述EDL概念以及技术体系

什么是进化深度学习？东北大学等最新《进化深度学习:原理、算法、应用》综述，34页pdf阐述EDL概念以及技术体系

专知

1+阅读 · 2022年9月1日

【KDD2022教程】在线聚类:算法、评估、指标、应用和基准，附75页ppt

【KDD2022教程】在线聚类:算法、评估、指标、应用和基准，附75页ppt

专知

1+阅读 · 2022年8月22日

【干货书】大规模文本数据的结构化知识挖掘，200页pdf

【干货书】大规模文本数据的结构化知识挖掘，200页pdf

专知

1+阅读 · 2022年8月21日

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

专知

22+阅读 · 2020年7月25日

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

PaperWeekly

24+阅读 · 2019年11月6日

量子算法理论专题讲习班

国家自然科学基金

16+阅读 · 2017年12月31日

贝叶斯网分解理论及其应用

国家自然科学基金

14+阅读 · 2017年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

海量数据流实时分发技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

2+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

479+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

VIP会员

相关主题

相关VIP内容

CVPR 2023开会了！UIUC等最新《知识驱动的视觉语言编码》教程，附ppt

CVPR 2023开会了！UIUC等最新《知识驱动的视觉语言编码》教程，附ppt

专知会员服务

34+阅读 · 2023年6月24日

电子科大最新《深度聚类》全面综述，20页pdf涵盖260篇文献全面阐述深度聚类方法

电子科大最新《深度聚类》全面综述，20页pdf涵盖260篇文献全面阐述深度聚类方法

专知会员服务

109+阅读 · 2022年10月16日

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

专知会员服务

111+阅读 · 2022年10月5日

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

专知会员服务

41+阅读 · 2022年9月19日

百度北京大学发布首篇《自然语言生成保真性》综述论文，52页pdf系统性阐述NLG分析、评价和优化方法

百度北京大学发布首篇《自然语言生成保真性》综述论文，52页pdf系统性阐述NLG分析、评价和优化方法

专知会员服务

28+阅读 · 2022年3月11日

符号还是神经？AAAI2022Mila唐建团队《知识图谱推理进展》教程，150页ppt全面讲解符号逻辑神经推理方法

符号还是神经？AAAI2022Mila唐建团队《知识图谱推理进展》教程，150页ppt全面讲解符号逻辑神经推理方法

专知会员服务

98+阅读 · 2022年2月25日

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

专知会员服务

132+阅读 · 2022年1月11日

【干货书-IBM推荐】机器学习傻瓜式入门，75页pdf

【干货书-IBM推荐】机器学习傻瓜式入门，75页pdf

专知会员服务

52+阅读 · 2020年9月29日

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

专知会员服务

157+阅读 · 2019年11月26日

【ICML 2019 | 元学习教程】伯克利Chelsea Finn、Sergey Levine主讲，附111PDF

【ICML 2019 | 元学习教程】伯克利Chelsea Finn、Sergey Levine主讲，附111PDF

专知会员服务

54+阅读 · 2019年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

不可错过！CMU《结构化数据机器学习》课程，附Slides

不可错过！CMU《结构化数据机器学习》课程，附Slides

专知

0+阅读 · 2022年11月2日

电子科大最新《深度聚类》全面综述，20页pdf涵盖260篇文献全面阐述深度聚类方法

电子科大最新《深度聚类》全面综述，20页pdf涵盖260篇文献全面阐述深度聚类方法

专知

1+阅读 · 2022年10月16日

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

专知

3+阅读 · 2022年10月7日

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

专知

4+阅读 · 2022年10月5日

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

专知

0+阅读 · 2022年9月19日

什么是进化深度学习？东北大学等最新《进化深度学习:原理、算法、应用》综述，34页pdf阐述EDL概念以及技术体系

什么是进化深度学习？东北大学等最新《进化深度学习:原理、算法、应用》综述，34页pdf阐述EDL概念以及技术体系

专知

1+阅读 · 2022年9月1日

【KDD2022教程】在线聚类:算法、评估、指标、应用和基准，附75页ppt

【KDD2022教程】在线聚类:算法、评估、指标、应用和基准，附75页ppt

专知

1+阅读 · 2022年8月22日

【干货书】大规模文本数据的结构化知识挖掘，200页pdf

【干货书】大规模文本数据的结构化知识挖掘，200页pdf

专知

1+阅读 · 2022年8月21日

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

专知

22+阅读 · 2020年7月25日

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

PaperWeekly

24+阅读 · 2019年11月6日

相关基金

量子算法理论专题讲习班

国家自然科学基金

16+阅读 · 2017年12月31日

贝叶斯网分解理论及其应用

国家自然科学基金

14+阅读 · 2017年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

海量数据流实时分发技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

2+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

479+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

微信扫码咨询专知VIP会员