Nowadays, the product search service of e-commerce platforms has become a vital shopping channel in people's life. The retrieval phase of products determines the search system's quality and gradually attracts researchers' attention. Retrieving the most relevant products from a large-scale corpus while preserving personalized user characteristics remains an open question. Recent approaches in this domain have mainly focused on embedding-based retrieval (EBR) systems. However, after a long period of practice on Taobao, we find that the performance of the EBR system is dramatically degraded due to its: (1) low relevance with a given query and (2) discrepancy between the training and inference phases. Therefore, we propose a novel and practical embedding-based product retrieval model, named Multi-Grained Deep Semantic Product Retrieval (MGDSPR). Specifically, we first identify the inconsistency between the training and inference stages, and then use the softmax cross-entropy loss as the training objective, which achieves better performance and faster convergence. Two efficient methods are further proposed to improve retrieval relevance, including smoothing noisy training data and generating relevance-improving hard negative samples without requiring extra knowledge and training procedures. We evaluate MGDSPR on Taobao Product Search with significant metrics gains observed in offline experiments and online A/B tests. MGDSPR has been successfully deployed to the existing multi-channel retrieval system in Taobao Search. We also introduce the online deployment scheme and share practical lessons of our retrieval system to contribute to the community.


翻译:目前,电子商务平台的产品搜索服务已成为人们生活中一个至关重要的购物渠道。产品的检索阶段决定了搜索系统的质量,并逐渐吸引研究人员的注意。从大型产品库中检索最相关的产品,同时保留个性化用户特性仍然是一个未决问题。这一领域最近的做法主要侧重于嵌入检索系统(EBR),然而,经过对道保的长期实践,我们发现EBR系统的性能由于以下原因急剧退化:(1) 与特定查询的相关性低,(2) 培训和推断阶段之间的差异。因此,我们建议采用一个新的和实用的嵌入产品检索模式,名为多层深层产品检索(MGDSPR)。具体地说,我们首先确定培训和推断阶段之间的不一致,然后将软体跨作物损失作为培训目标,从而实现更好的业绩和更快的趋同。我们进一步提出了两种有效的方法来改进检索相关性,包括调整调培训数据,并改进基于嵌入的硬层产品回收模式,即称为多层深层深度深度深层产品检索模型(MARPR) 。我们还成功地评估了在线搜索系统对AMAG系统进行在线搜索和升级。我们所观察到的系统进行在线搜索的系统。我们已进行了在线搜索和测试。

1
下载
关闭预览

相关内容

专知会员服务
37+阅读 · 2021年4月27日
【WWW2021】场矩阵分解机推荐系统
专知会员服务
31+阅读 · 2021年2月27日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
计算机 | 中低难度国际会议信息8条
Call4Papers
9+阅读 · 2019年6月19日
计算机 | IUI 2020等国际会议信息4条
Call4Papers
6+阅读 · 2019年6月17日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
LibRec 精选:位置感知的长序列会话推荐
LibRec智能推荐
3+阅读 · 2019年5月17日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Arxiv
12+阅读 · 2020年6月20日
Learning to Weight for Text Classification
Arxiv
8+阅读 · 2019年3月28日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
3+阅读 · 2018年2月24日
VIP会员
Top
微信扫码咨询专知VIP会员