现代搜索引擎需要能够处理多种类型的用户查询,包括常见的、不常见的,甚至从未见过的查询,同时还要能够应对无误或包含错误的查询。此外,它们还必须能够适应新的领域,并在资源受限的环境中高效运行,以保障可访问性和可扩展性。为了满足用户期望并应对日益复杂的查询需求,现代搜索引擎需要:(i)提供对非结构化知识源以及结构化知识源的访问能力;(ii)进一步支持问答功能,在搜索结果页面中直接返回查询答案;(iii)支持多种查询表达方式,例如文本、语音和图像。
本文旨在构建稳健的神经检索器,以支持现代搜索引擎的多项核心功能。我们特别关注如何在嘈杂和低资源环境下提升神经检索器的鲁棒性与有效性。首先,我们研究了查询中错误对神经检索器在即席检索(ad-hoc retrieval)任务中性能的影响,并提出了增强其鲁棒性的方法。随后,我们探索了在语音查询与文本文档之间进行多模态检索的神经方法。接着,我们分析了在计算资源受限的条件下训练高效神经检索器所面临的挑战,尤其是针对需要多跳检索的复杂用户查询。最后,我们探讨了神经检索如何用于提升知识图谱问答系统中关系预测的性能,尤其是在此前未见过的领域中。