阿里+南洋理工,基于GNN的电商产品属性预测

2021 年 12 月 30 日 图与推荐
本文原著为:“Heterogeneous Star Graph AttentionNetwork for Product Attributes Prediction”
出版于:“Advanced Engineering Informatics”(2021)
作者:Xuejiao Zhao (赵雪娇), Yong Liu (刘勇), Yonghui Xu (徐庸辉), Yonghua Yang (杨勇华), Xusheng Luo (骆徐圣), Chunyan Miao (苗春燕)
合作单位:南洋理工大学百合研究中心,阿里巴巴集团,阿里巴巴-南洋理工大学新加坡联合研究院(JRI),山东大学-南洋理工大学人工智能国际联合研究院(C-FAIR)






作者简介

赵雪娇,南洋理工大学百合研究中心博士后研究员,博士毕业于新加坡南洋理工大学计算机科学与工程学院。研究方向包括人工智能+健康医疗,知识图谱,软件工程等。近年来发表高水平学术论文20余篇,包括 TNNLS、AEI、CAIE、CHI、IJCAI、ICSME、ISSRE等国际计算机领域期刊和会议,拥有国家专利2项。担任CHI,InformationSciences, IEEE Transactions on Services Computing的审稿人。曾获得IJCAI (CCF A) 的最佳呈现短片,ICSME (CCF B) 杰出论文,ISSRE (CCF B) 最佳工业论文等荣誉。主办了 IJCAI 2021-Al forCognitive and Physical Frailty Workshop,担任国际会议ICCSE的PC Member。参与与医生合作的人工智能健康,医疗相关项目4项,并担任1项国家自然科学基金项目的海外专家和1项阿里AIR项目的Co-PI。


研究背景

产品属性是与产品相关的用于定义和区分产品的一组特征,如尺寸、颜色、款式、适用场景、年代、事件等。这些属性在电子商务的消费者的购买决策中起着重要的作用,它们在产品推荐、个性化搜索、广告等方面也很重要。一项关于电子商务研究结果表明,约20%的搜索失败可能是由于缺少或不准确的电子商务产品的属性导致的。为了提高搜索性能,降低用户的搜索失败率,产品属性预测算法对电子商务具有重要意义。

在阿里巴巴大量的实际应用中,我们发现在电商场景中的产品属性有两种,分别为“具体属性”和“抽象属性”,如图1所示。具体属性是有形的,一般描述产品的一些可见的特征,如尺寸、颜色、材质等。而抽象属性则通常描述人为定义的产品的一些无形特征,如应用场景、适用事件、泳装类型等。一般来说,与具体属性相比,抽象属性更难从产品标题或产品介绍中提取。然而,抽象属性更符合用户对产品的期望和搜索习惯。例如,用户更倾向于使用关键字“泳衣 温泉” 来描述他们的需求和偏好,而不是“红色 尼龙 泳衣”。因此,属性预测,特别是对抽象产品属性的预测,对于电子商务的实际应用具有重要意义。根据我们的调查,现有的研究中很少有关注在产品的抽象属性生成,业界(包括阿里巴巴)目前普遍都是通过手工标记的方式给产品添加抽象属性。

图1.产品的具体属性和抽象属性


本文提出的系统架构

本文提出了一种半监督学习方法来解决抽象属性预测问题。具体来说,我们的目标是利用某些产品的具体属性标签和电子商务场景中的大量无监督信息(如用户交互数据) 对产品的抽象属性进行预测。我们发现,在电子商务场景中,这些信息总是以异构星图的形式呈现,而这些异构星图的中心节点通常是一个产品。连接在中心节点上的周边节点类型则多种多样,主要是产品本身的信息和产品的交互信息,如用户交互、产品标题、产品介绍、产品属性等。根据这些观察,我们提出了一种名为“SAN” 的异构星图注意网络,该网络融合了电子商务场景中多种信息的优势,用于预测产品的抽象属性。如图2所示,SAN利用并行注意机制来学习各种节点的特征权重,如外围节点、其他星形图中的其他产品节点等。该学习方案可以同时利用无监督图结构信息和属性用于构造抽象属性预测器。

图2.SAN 的结构图

我们在真实世界的电子商务数据集上进行了广泛的实验。如表1所示,实验结果表明SAN的性能明显优于现有方法,可以为电子商务产品提供更快、更准确的产品抽象属性标记服务。这些可以促进属性标记的数字化转型,提高搜索性能,降低用户的搜索失败率。

表1. SAN 预测抽象属性的性能


应用推广

除了本文描述的应用场景,SAN模型及其提取的抽象产品属性在电子商务场景中还有其他广泛的应用。

  • 具有相同图结构的预测任务:除了能够预测抽象属性,SAN还可以用于其他具有相同图结构的预测任务。例如,SAN可以利用用户交互信息(如使用同样的关键词,购买同样的产品等)做产品推荐中的潜在用户预测。
  • 抽象关键词搜索,场景搜索:抽象的产品属性更加流行符合用户对产品的期望和搜索习惯电子商务场景。因此,通过SAN提取产品的抽象属性可以用来提高用户使用抽象关键词的搜索准确度。
  • 搜索结果筛选过滤:除了被使用在搜索过程中,还可以使用抽象产品属性作为筛选搜索结果的选项,以进一步根据用户的需求筛选满足条件的产品。
  • 目的导向的产品推荐:抽象产品属性可用于连接用于相同目的的产品场景、事件、职业等,因此它们可以用于目的导向的产品推荐。例如,一个用户购买了产品“泳装”适合事件 ——“温泉”。因此,用户可能还需要面膜、旅行箱、毛巾、手机防水袋等。


相关资源

本文官方Pytorch实现在Github上面的开放源码链接:

https://github.com/zxjwudi/SAN-for-Product-Attributes-Prediction

随本文的发表同时开源的还有一个优质的电商用户交互数据集,该数据集搜集自阿里巴巴的淘宝网,它是中国最受欢迎的电子商务网站之一。在这个数据集中,有1,897,339条用户交互记录。每个交互记录都包含一个查询、一个用户ID、一个产品ID、一个产品标题以及该产品的相应属性集。现有的大多数开源产品属性集都来自于爬行时尚产品属性和描述,或者直接从大型网购网站的标题中提取。而我们的数据集中的属性是由时尚和服装专家手工注释的,所以这个数据集拥有很好的准确性和质量。阿里用户交互数据集链接:

https://github.com/zxjwudi/Alibaba-Custermers-Interaction-Dataset



编辑 | 钟   鹏


登录查看更多
0

相关内容

一个具体事物,总是有许许多多的性质与关系,我们把一个事物的性质与关系,都叫作事物的属性。 事物与属性是不可分的,事物都是有属性的事物,属性也都是事物的属性。 一个事物与另一个事物的相同或相异,也就是一个事物的属性与另一事物的属性的相同或相异。 由于事物属性的相同或相异,客观世界中就形成了许多不同的事物类。具有相同属性的事物就形成一类,具有不同属性的事物就分别地形成不同的类。
AAAI 2022|对抗攻击鲁棒的异质图神经网络
专知会员服务
35+阅读 · 2022年3月28日
CIKM2021 | 异质图上的图神经网络对比预训练
专知会员服务
15+阅读 · 2021年11月8日
【WWW2021】用于常识知识提取的高级语义
专知会员服务
11+阅读 · 2021年2月16日
近期必读的5篇 WSDM 2020【图神经网络(GNN)】相关论文
专知会员服务
56+阅读 · 2020年1月10日
南洋理工大学,深度学习推荐系统综述
专知会员服务
174+阅读 · 2019年10月14日
AAAI 2022|对抗攻击鲁棒的异质图神经网络
专知
3+阅读 · 2022年3月29日
图表示学习在美团推荐中的应用
图与推荐
1+阅读 · 2021年12月24日
PSU Suhang Wang招图神经网络方向全奖博士生
图与推荐
0+阅读 · 2021年10月27日
论文浅尝 | 基于知识图谱中图卷积神经网络的推荐系统
开放知识图谱
67+阅读 · 2019年8月27日
HAN:基于双层注意力机制的异质图深度神经网络
PaperWeekly
36+阅读 · 2019年4月23日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
19+阅读 · 2021年2月4日
Arxiv
12+阅读 · 2020年6月20日
Arxiv
35+阅读 · 2020年1月2日
VIP会员
相关VIP内容
AAAI 2022|对抗攻击鲁棒的异质图神经网络
专知会员服务
35+阅读 · 2022年3月28日
CIKM2021 | 异质图上的图神经网络对比预训练
专知会员服务
15+阅读 · 2021年11月8日
【WWW2021】用于常识知识提取的高级语义
专知会员服务
11+阅读 · 2021年2月16日
近期必读的5篇 WSDM 2020【图神经网络(GNN)】相关论文
专知会员服务
56+阅读 · 2020年1月10日
南洋理工大学,深度学习推荐系统综述
专知会员服务
174+阅读 · 2019年10月14日
相关基金
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员