We study the problem of query attribute value extraction, which aims to identify named entities from user queries as diverse surface form attribute values and afterward transform them into formally canonical forms. Such a problem consists of two phases: {named entity recognition (NER)} and {attribute value normalization (AVN)}. However, existing works only focus on the NER phase but neglect equally important AVN. To bridge this gap, this paper proposes a unified query attribute value extraction system in e-commerce search named QUEACO, which involves both two phases. Moreover, by leveraging large-scale weakly-labeled behavior data, we further improve the extraction performance with less supervision cost. Specifically, for the NER phase, QUEACO adopts a novel teacher-student network, where a teacher network that is trained on the strongly-labeled data generates pseudo-labels to refine the weakly-labeled data for training a student network. Meanwhile, the teacher network can be dynamically adapted by the feedback of the student's performance on strongly-labeled data to maximally denoise the noisy supervisions from the weak labels. For the AVN phase, we also leverage the weakly-labeled query-to-attribute behavior data to normalize surface form attribute values from queries into canonical forms from products. Extensive experiments on a real-world large-scale E-commerce dataset demonstrate the effectiveness of QUEACO.


翻译:我们研究查询属性值提取问题,目的是从用户查询中找出被命名的实体,作为不同表面形式的属性值,然后将其转化为正式的卡通形式。这样的问题包括两个阶段:{名称实体识别(NER)}和{属性值正常化(AVN)}。然而,现有的工作只侧重于NER阶段,而忽视了同等重要的AVN。为了缩小这一差距,本文件提议在电子商务搜索中建立一个统一的查询属性提取系统,名为QUEACO,它涉及两个阶段。此外,通过利用大规模标记为薄弱的行为数据,我们以较低的监督成本进一步改进了提取绩效。具体来说,对于NNER阶段,QUEACO采用了一个新的师范网络,在这个网络中,一个受过高标签数据培训的教师网络生成了假标签,以完善培训学生网络的标签薄弱标签数据。同时,教师网络可以动态地适应学生在强烈标签上的数据表现的反馈,以便从薄弱的Gloan-al-al-al-al-al-al-al-al-al-al-lab-al-al-al-al-degrational-degration a dal-labal-dal-dal-dal-dal-dal-d-dal-dal-dal-dal-d-daltragal-dal-dal-dal-dal-dal-d-d-d-dal-dal-dalgalgal-dal-dal-dal-d-d-d-d-d-d-d-dalgrogration-dal-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-dal-d-d-d-d-d-d-d-dal-d-dal-dal-dal-d-daldal-d-d-dal-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-d-

0
下载
关闭预览

相关内容

【KDD2021】图神经网络,NUS- Xavier Bresson教授
专知会员服务
63+阅读 · 2021年8月20日
专知会员服务
76+阅读 · 2021年3月16日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
已删除
将门创投
3+阅读 · 2019年5月6日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年10月15日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
7+阅读 · 2018年11月29日
Arxiv
10+阅读 · 2017年7月4日
VIP会员
相关VIP内容
【KDD2021】图神经网络,NUS- Xavier Bresson教授
专知会员服务
63+阅读 · 2021年8月20日
专知会员服务
76+阅读 · 2021年3月16日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
已删除
将门创投
3+阅读 · 2019年5月6日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员