AI驱动的搜索引擎 使用最新的机器学习技术和大型语言模型构建搜索引擎。 《AI驱动的搜索引擎》向您展示如何构建能够从用户和内容中不断学习的最先进搜索引擎,为您提供更具领域感知和智能化的搜索体验。 书中您将学习到的数据科学驱动的现代搜索技术包括:
使用基础模型中的密集向量嵌入进行语义搜索
检索增强生成(Retrieval-Augmented Generation,RAG)
结合搜索和大型语言模型(LLM)的问答和摘要功能
微调基于Transformers的LLM
基于用户信号和向量嵌入的个性化搜索
收集用户行为信号并构建信号增强模型
语义知识图谱用于特定领域学习
实现机器学习排名模型(学习排名)
构建点击模型以自动化机器学习排名
生成式搜索、混合搜索以及搜索前沿技术
当今的搜索引擎需要变得更聪明,理解自然语言查询的细微差别,以及每个用户的偏好和上下文信息。这本书将帮助您构建能够利用用户互动和内容中的隐藏语义关系,自动提供更好、更相关搜索体验的搜索引擎。您甚至会学习如何整合大型语言模型(LLM),如GPT和其他基础模型,以极大地加速搜索技术的能力。 关于本书 《AI驱动的搜索引擎》是一本实用指南,帮助您将最前沿的数据科学技术应用于搜索。它教您如何构建能够自动理解用户查询意图的搜索引擎,从而显著提高搜索结果的相关性。 您将使用LLM进行嵌入、问答和结果摘要,并学习如何对它们进行微调以获得最佳结果。通过交互式笔记本中的代码,您将部署智能AI驱动的搜索系统,为每个用户、领域和查询提供实时个性化和上下文理解,并通过自学习搜索平台不断从不断发展的内容和用户互动中学习。 关于读者 适合熟悉搜索引擎技术基础知识的软件开发人员和数据科学家。 关于作者 * Trey Grainger 是Searchkernel(AI驱动搜索)的创始人,Presearch(去中心化网络搜索)的首席技术官,曾任Lucidworks(电子商务、站点和企业搜索)的首席算法官和工程高级副总裁。Trey还共同撰写了《Solr in Action》(Manning,2014)。 * Doug Turnbull 是Reddit(社交讨论搜索)的首席工程师,曾任Spotify(电子商务搜索)的员工级相关性工程师,曾任OpenSource Connections的首席技术官。Doug还共同撰写了《Relevant Search》(Manning,2016)。 * Max Irwin 是Max.io(AI模型扩展)的创始人,曾任OpenSource Connections(搜索相关性咨询)的管理顾问。