主题: Efficient and Effective Query Auto-Completion
摘要: 查询自动补全(QAC)是现代文本搜索系统的功能,它提出了可能的方式来完成由用户键入的查询。在百万级搜索空间中运行时,效率对于使系统具有实时响应能力至关重要。先前的工作广泛提倡在紧凑的空间中使用trie数据结构进行快速的前缀搜索操作。但是,按前缀搜索几乎没有发现能力,因为仅返回由查询前缀的补全。这可能会对QAC系统的有效性产生负面影响,从而对诸如Web搜索引擎和电子商务之类的实际应用造成金钱损失。在这项工作中,我们描述了在eBay上启用新QAC系统的实施,并讨论了其与最新技术的效率/有效性的关系。该解决方案基于倒排索引与简洁的数据结构的结合,这在文献中是鲜为探讨的方向。该系统取代了以前基于Apache SOLR的实现,该实现并不总是能够满足所需的服务级别协议。