【IJCAI2019】Part.2:10篇推荐系统相关论文阅读

2019 年 8 月 26 日 专知
【IJCAI2019】Part.2:10篇推荐系统相关论文阅读


导读

本文继续简要介绍10篇IJCAI2019会议最新推荐算法相关论文,涉及session-based推荐,序列推荐,异构网络HIN,图神经网络,对抗学习算法等。


编译 | Xiaowen



01



Correlation-Sensitive Next-Basket Recommendation


用户与项目的交互可以视为用户的潜在兴趣。我们关注的是通过观察到的序列来了解这些偏好。由于通常同时采用多个项目,例如,一篮子杂货或一些媒体消费,因此我们将一个basket的序列作为输入,推荐下一个basket。直观地讲,basket往往包含支持特定需求的相关物品组。我们假设,将项目之间的成对相关性信息纳入将有助于得出更一致的推荐,而不是为下一个basket单独推荐项目。为实现这一目标,我们开发了一种分层网络架构Beacon以建模basket序列。通过考虑项目的相对重要性和项目对之间的相关性对每个basket进行编码。对三个公开真实生活数据集的大量实验展示了我们的方法对于下一个basket推荐问题的有效性。

论文地址
https://www.ijcai.org/proceedings/2019/0389.pdf


02



A Review-Driven Neural Model for Sequential Recommendation

对购买的项目的写评论是在电子商务中表达用户意见的独特渠道。近来,已经提出了许多基于深度学习的解决方案,通过利用用户评论来进行评分预测。相反,很少有人试图利用由用户评论所涵盖的语义信号来完成协同过滤的任务。本文通过考虑用户“内在偏好(长期)”和“序列模式”(短期),提出了一种新的基于评论驱动的神经序列推荐模型(简称RNS)。详细地说,RNS被设计成用从评论中提取的aspect-aware的表示来编码每个用户或项目。给出用户的历史购买商品序列,设计了一种新的层次关注机制,用于在联合级(union-leave了)和独立级(individual-level)捕获序列模式。在三个不同领域的真实世界数据集上进行的广泛实验表明,相对于最新的最先进的序列推荐模型,RNS获得了显著的性能改进。

论文地址
https://www.ijcai.org/proceedings/2019/0397.pdf


03



DMRAN: A Hierarchical Fine-Grained Attention-Based Network for
Recommendation

用于下一个项目推荐的常规方法通常基于RNN或具有时间编码的一维注意力模型。它们很难保留不同交互之间的长期依赖关系,或者很难捕获细粒度的用户偏好。本文提出了一个双最相关的注意力网络(Double Most Relevant Attention Network,DMRAN),它包含两个层,项目级注意力层和特征级自注意力层,即从用户的历史行为序列中提取最相关的项目,并分别提取相关项目中最相关的方面(aspects)。然后,我们可以捕获细粒度的用户偏好,以便更好地支持下一项推荐。在两个真实世界的数据集上进行的广泛实验表明,与最先进的方法相比,DMRAN可以提高推荐的效率和有效性。

论文地址
https://www.ijcai.org/proceedings/2019/0513.pdf


04



Modeling Multi-Purpose Sessions for Next-Item Recommendations
via Mixture-Channel Purpose Routing Networks

一个基于会话的推荐系统 (session-based RS, SBRS) 通session中项之间的依赖关系建模来推荐下一个项目。大多数现有的 SBRS 假设一个session中的项与一个 (隐式)目的相关联。然而,这在现实中可能并不总是正确的,一个session通常可能由不同目的项目的多个子集组成(例如早餐和装饰)。具体来说,子集中的项目(例如面包和牛奶) 具有很强的特定目的依赖性,而来自不同子集的项目 (例如面包和花瓶)由于目的的不同而具有弱得多的依赖性,甚至没有依赖性。因此,我们提出了一种混合信道(mixture-channel)模型,以适应多目的项目子集,以便更精确地表示session。为了解决现有SBRS中的缺陷,该模型推荐更多不同的项目以满足不同的目的。因此,我们设计了一种有效混合信道目的路由网络(mixture-channel purpose routing networks, MCPRNS),以检测每个项目的目的并将它们分配到相应的信道中。此外,设计了专用递归网络(purpose-specific recurrent network)来对每个通道内的项目之间的相关性进行建模。实验结果表明,基于推荐的准确性和多样性,MCPRN优于现有的方法。

论文地址
https://www.ijcai.org/proceedings/2019/0523.pdf


05



Unified Embedding Model over Heterogeneous Information Network for
Personalized Recommendation

大多数异构信息网络(HIN)的推荐模型基于具有元路径的用户和项目建模。然而,它们总是模型用户和在每个元路径下隔离的项目,这可能导致信息提取产生误导。此外,他们只考虑HINs在探索HINs过程中建模用户和项目时的结构特征,这可能会导致有用信息不可逆地丢失。为了解决这些问题,我们提出了一个基于HIN的统一嵌入模型,称为HueRec。我们假设在每个用户或项目的不同元路径下存在一些共同特征,并且使用来自所有元路径的数据来学习统一用户和项目表示。因此,利用元路径之间的相互关系来缓解单通道上的数据稀疏和噪声问题。与先探索HINs然后推荐的现有模型不同,我们将这两个部分合并成一个端到端的模型,以避免在初始阶段丢失有用的信息。此外,我们还将所有用户、项和元路径嵌入到相关的潜在空间中,因此我们可以测量用户对元路径的偏好,从而提高个性化推荐的性能。广泛的实验表明,hueRec的性能优于最先进的方法。

论文地址
https://www.ijcai.org/proceedings/2019/0529.pdf


06



Neural News Recommendation with Attentive Multi-View Learning

个性化的新闻推荐对于在线新闻平台来说是非常重要的,以帮助用户找到感兴趣的新闻并改善用户体验。新闻和用户表示学习对于新闻推荐至关重要。现有的新闻推荐方法通常基于单个新闻信息(例如,标题)来学习这些表示,这可能是不够的。本文提出了一种利用不同的新闻信息来学习用户和新闻的信息表达的神经新闻推荐方法。我们的方法的核心是一个新闻编码器和一个用户编码器。在新闻编码器中,我们提出了一种专注的多视点学习模型(attentive multi-view learning model),通过将标题、主体和主题类别看作不同的新闻视点来学习统一的新闻表示。此外,我们还将文字级和视图级的注意力机制应用于新闻编码器中,选择重要的词汇和视图来学习信息性新闻表示。在用户编码器中,我们根据用户浏览的新闻来学习用户的信息表示,并应用注意力机制选择信息新闻进行用户表示学习。在一个真实的数据集上进行的大量实验表明,我们的方法能够有效地提高新闻推荐的性能。

论文地址
https://www.ijcai.org/proceedings/2019/0536.pdf


07



PD-GAN: Adversarial Learning for Personalized Diversity-Promoting
Recommendation

本文提出了一种新的推荐模型-个性化多样性提升GAN(Personalized Diversity-promoting GAN,PD-GAN)。具体而言,对于每个用户,生成器通过从个性化的确定点过程(personalized Determinantal Point Process,DPP)核矩阵中进行序列抽样来推荐一组不同的相关项。该核矩阵由两个可学习的组件构成:多个项目的一般共现性和用户对项的个人偏好。为了学习第一部分,我们提出了一种新的使用训练对的成对学习范式,每个训练对由一组不同的项目和一组随机抽取的所有用户的观察数据组成。第二部分是通过针对判别器的对抗性训练来学习的,该判别器致力于从目标用户的观察数据中随机抽取推荐项目和ground truth之间的区别。实验结果表明,PD-GAN能更好地生成既多样又相关的推荐方案。

论文地址
https://www.ijcai.org/proceedings/2019/0537.pdf


08


Graph Contextualized Self-Attention Network for Session-based Recommendation

基于session的推荐是许多在线服务(比如电子商务、媒体流)中的一项关键任务。近年来,自注意力网络(SAN)在不使用递归或卷积网络的情况下,在各种序列建模任务中取得了显著的成功。然而,SAN缺乏在相邻项上存在的局部依赖关系,并且限制了它学习序列中项的上下文表示的能力。本文提出了一种利用图神经网络和自注意力机制进行session推荐的图上下文自注意力模型(GC-SAN)。在GC-SAN中,我们动态地构造了session序列的图结构,并通过图神经网络(GNN)捕获了丰富的局部依赖关系。然后,每个session通过应用自注意力机制来学习长期依赖关系。最后,每一个session被表示为全局偏好和当前兴趣的线性组合。在两个真实世界的数据集上进行的广泛实验表明,GC-SAN的性能始终优于最先进的方法。

论文地址
https://www.ijcai.org/proceedings/2019/0547.pdf


09



DARec: Deep Domain Adaptation for Cross-Domain Recommendation via
Transferring Rating Patterns

跨域推荐长期以来一直是推荐系统中的主要研究课题之一,近年来,人们提出了各种深度模型来进行跨域的知识迁移,但大多侧重于从辅助内容(如图像和评论文本)中提取抽象的可迁移特征,而评分矩阵本身中的模式很少被触及。本文在域自适应概念的启发下,提出了一种深度域自适应模型(DARec),该模型能够在不依赖任何辅助信息的情况下,从评分矩阵中提取和传递模式。我们在公共数据集上实证地证明了我们的方法在几种最先进的可供选择的跨域推荐模型中取得了最佳的性能。

论文地址
https://www.ijcai.org/proceedings/2019/0587.pdf


10



STAR-GCN: Stacked and Reconstructed Graph Convolutional Networks for
Recommender Systems

为了提高推荐系统的性能,特别是在冷启动场景中,我们提出了一种新的叠加重构图卷积网络(STAcked and Reconstructed Graph Convolutional Networks, STAR-GCN)体系结构。STAR-GCN采用了一堆GCN编解码器与中间监督相结合,以提高最终的预测性能。与one-hot编码节点输入的图卷积矩阵完成模型不同,我们的STAR-GCN学习低维用户和项的潜在因素作为输入,以抑制模型空间复杂度。此外,我们的STAR-GCN可以通过重构隐藏的输入节点嵌入来生成新节点的节点嵌入,这实质上解决了冷启动问题。此外,在对基于GCN的链路预测任务模型进行训练时,我们发现了一个标签泄漏问题(label leakage issue),并提出了一种避免该问题的训练策略。对多个评分数据集的实证结果表明,我们的模型在五分之四的数据集中取得了最先进的性能,并在冷启动场景中预测评分方面有了显著的改进。

论文地址
https://www.ijcai.org/proceedings/2019/0592.pdf
代码地址:
https://github.com/jennyzhang0215/star-gcn



-END-
专 · 知


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎登录www.zhuanzhi.ai,注册登录专知,获取更多AI知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询
请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询技术商务合作~
专知《深度学习:算法到实战》课程全部完成!560+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!
点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程
登录查看更多
30

相关内容

【导读】作为CCF推荐的A类国际学术会议,International ACM SIGIR Conference on Research and Development in Information Retrieval(国际计算机学会信息检索大会,简称 SIGIR)在信息检索领域享有很高的学术声誉,每年都会吸引全球众多专业人士参与。今年的 SIGIR 2020计划将于 2020年7月25日~30日在中国西安举行。本次大会共有555篇长文投稿,仅有147篇长文被录用,录用率约26%。专知小编提前为大家整理了六篇SIGIR 2020 基于图神经网络的推荐(GNN+RS)相关论文,这六篇论文分别出自中科大何向南老师和和昆士兰大学阴红志老师团队,供大家参考——捆绑推荐、Disentangled GCF、服装推荐、多行为推荐、全局属性GNN

CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN

1. Bundle Recommendation with Graph Convolutional Networks

作者:Jianxin Chang, Chen Gao, Xiangnan He, Yong Li, Depeng Jin

摘要:捆绑推荐(Bundle recommendation )旨在推荐一组商品供用户整体消费。现有的解决方案通过共享模型参数或多任务学习的方式将用户项目交互建模集成到捆绑推荐中,然而,这些方法不能显式建模项目与捆绑包(bundles)之间的隶属关系,不能探索用户选择捆绑包时的决策。在这项工作中,我们提出了一个用于捆绑推荐的图神经网络模型BGCN(Bundle Graph Convolutional Network)。BGCN将用户-项目交互、用户-捆绑包交互和捆绑包-项目从属关系统一到一个异构图中。以项目节点为桥梁,在用户节点和捆绑包节点之间进行图卷积传播,使学习到的表示能够捕捉到项目级的语义。通过基于hard-negative采样器的训练,可以进一步区分用户对相似捆绑包的细粒度偏好。在两个真实数据集上的实验结果表明,BGCN的性能有很高的提升,其性能比最新的基线高出10.77%到23.18%。

网址: https://arxiv.org/abs/2005.03475

2. Disentangled Graph Collaborative Filtering

作者:Xiang Wang, Hongye Jin, An Zhang, Xiangnan He, Tong Xu, Tat-Seng Chua

摘要:从交互数据中学习用户和项目的信息表示对于协同过滤(CF)至关重要。当前的嵌入函数利用用户-项目关系来丰富表示,从单个用户-项目实例演变为整体交互图。然而,这些方法在很大程度上以统一的方式对关系进行建模,而忽略了用户采用这些项目的意图的多样性,这可能是为了打发时间,为了兴趣,或者为其他人(如家庭)购物。这种统一的对用户兴趣建模的方法很容易导致次优表示,不能对不同的关系建模并在表示中分清用户意图。在这项工作中,我们特别关注用户意图细粒度上的用户-项目关系。因此,我们设计了一种新的模型- Disentangled图协同过滤(Disentangled Graph Collaborative Filtering ,DGCF),来理清这些因素并产生disentangled的表示。具体地说,通过在每个用户-项目交互意图上的分布建模,我们迭代地细化意图感知的交互图和表示。同时,我们鼓励不同的意图独立。这将生成disentangled的表示,有效地提取与每个意图相关的信息。我们在三个基准数据集上进行了广泛的实验,DGCF与NGCF、DisenGCN和MacridV AE这几个最先进的模型相比取得了显著的改进。进一步的分析揭示了DGCF在分解用户意图和表示的可解释性方面的优势。

网址:

http://staff.ustc.edu.cn/~hexn/

代码链接:

https://github.com/xiangwang1223/disentangled_graph_collaborative_filtering.

3. GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection

作者:Shijie Zhang, Hongzhi Yin, Tong Chen, Quoc Viet Nguyen Hung, Zi Huang, Lizhen Cui

摘要:近年来,推荐系统已经成为所有电子商务平台中不可缺少的功能。推荐系统的审查评级数据通常来自开放平台,这可能会吸引一群恶意用户故意插入虚假反馈,试图使推荐系统偏向于他们。此类攻击的存在可能会违反高质量数据始终可用的建模假设,而这些数据确实会影响用户的兴趣和偏好。因此,构建一个即使在攻击下也能产生稳定推荐的健壮推荐系统具有重要的现实意义。本文提出了一种基于GCN的用户表示学习框架GraphRf,该框架能够统一地进行稳健的推荐和欺诈者检测。在其端到端学习过程中,用户在欺诈者检测模块中被识别为欺诈者的概率自动确定该用户的评级数据在推荐模块中的贡献;而在推荐模块中输出的预测误差作为欺诈者检测模块中的重要特征。因此,这两个组成部分可以相互促进。经过大量的实验,实验结果表明我们的GraphRf在鲁棒评级预测和欺诈者检测这两个任务中具有优势。此外,所提出的GraphRf被验证为对现有推荐系统上的各种攻击具有更强的鲁棒性。

网址:

https://arxiv.org/abs/2005.10150

4. Hierarchical Fashion Graph Network for Personalized Outfit Recommendation

作者:Xingchen Li, Xiang Wang, Xiangnan He, Long Chen, Jun Xiao, Tat-Seng Chua

摘要:服装推荐越来越受到网购服务商和时尚界的关注。与向用户推荐单个单品(例如,朋友或图片)的其他场景(例如,社交网络或内容共享)不同,服装推荐预测用户对一组匹配良好的时尚单品的偏好。因此,进行高质量的个性化服装推荐应满足两个要求:1)时尚单品的良好兼容性;2)与用户偏好的一致性。然而,目前的研究主要集中在其中一个需求上,只考虑了用户-全套服装(outfit)或全套服装-项目的关系,从而容易导致次优表示,限制了性能。在这项工作中,我们统一了两个任务,服装兼容性建模和个性化服装推荐。为此,我们开发了一个新的框架,层次时尚图网络(HFGN),用于同时建模用户、商品和成套服装之间的关系。特别地,我们构建了一个基于用户-全套服装交互和全套服装-项目映射的层次结构。然后,我们从最近的图神经网络中得到启发,在这种层次图上使用嵌入传播,从而将项目信息聚合到一个服装表示中,然后通过他/她的历史服装来提炼用户的表示。此外,我们还对这两个任务进行了联合训练,以优化这些表示。为了证明HFGN的有效性,我们在一个基准数据集上进行了广泛的实验,HFGN在NGNN和FHN等最先进的兼容性匹配模型基础上取得了显著的改进。

网址:

https://arxiv.org/abs/2005.12566

代码链接:

https://github.com/xcppy/hierarchical_fashion_graph_network

5. Multi-behavior Recommendation with Graph Convolutional Networks

作者:Bowen Jin, Chen Gao, Xiangnan He, Depeng Jin, Yong Li

摘要:传统的推荐模型通常只使用一种类型的用户-项目交互,面临着严重的数据稀疏或冷启动问题。利用多种类型的用户-项目交互(例如:点击和收藏)的多行为推荐可以作为一种有效的解决方案。早期的多行为推荐研究未能捕捉到行为对目标行为的不同程度的影响。它们也忽略了多行为数据中隐含的行为语义。这两个限制都使得数据不能被充分利用来提高对目标行为的推荐性能。在这项工作中,我们创新性地构造了一个统一的图来表示多行为数据,并提出了一种新的模型--多行为图卷积网络(Multi-Behavior Graph Convolutional Network,MBGCN)。MBGCN通过用户-项目传播层学习行为强度,通过项目-项目传播层捕获行为语义,较好地解决了现有工作的局限性。在两个真实数据集上的实验结果验证了该模型在挖掘多行为数据方面的有效性。我们的模型在两个数据集上的性能分别比最优基线高25.02%和6.51%。对冷启动用户的进一步研究证实了该模型的实用性。

网址:

http://staff.ustc.edu.cn/~hexn/

6. GAG: Global Atributed Graph Neural Network for Streaming Session-based Recommendation

作者:Ruihong Qiu, Hongzhi Yin, Zi Huang, Tong Chen

摘要:基于流会话的推荐(Streaming session-based recommendation,SSR)是一项具有挑战性的任务,它要求推荐器系统在流媒体场景(streaming scenario)中进行基于会话的推荐(SR)。在电子商务和社交媒体的现实应用中,在一定时间内产生的一系列用户-项目交互被分组为一个会话,这些会话以流的形式连续到达。最近的SR研究大多集中在静态集合上,即首先获取训练数据,然后使用该集合来训练基于会话的推荐器模型。他们需要对整个数据集进行几个epoch的训练,这在流式设置下是不可行的。此外,由于对用户信息的忽视或简单使用,它们很难很好地捕捉到用户的长期兴趣。虽然最近已经提出了一些流推荐策略,但它们是针对个人交互流而不是会话流而设计的。本文提出了一种求解SSR问题的带有Wasserstein 库的全局属性图(GAG)神经网络模型。一方面,当新的会话到达时,基于当前会话及其关联用户构造具有全局属性的会话图。因此,GAG可以同时考虑全局属性和当前会话,以了解会话和用户的更全面的表示,从而在推荐中产生更好的性能。另一方面,为了适应流会话场景,提出了Wasserstein库来帮助保存历史数据的代表性草图。在两个真实数据集上进行了扩展实验,验证了GAG模型与最新方法相比的优越性。

网址: https://sites.google.com/site/dbhongzhi/

成为VIP会员查看完整内容
0
134

【导读】国际万维网大会(The Web Conference,简称WWW会议)是由国际万维网会议委员会发起主办的国际顶级学术会议,创办于1994年,每年举办一届,是CCF-A类会议。WWW 2020将于2020年4月20日至4月24日在中国台湾台北举行。由于疫情影响,会议在线上举行。本届会议共收到了1129篇长文投稿,录用217篇长文,录用率为19.2%。上周专知小编整理了WWW 2020 推荐系统相关论文-part2,这期小编继续为大家奉上WWW 2020六篇推荐系统相关论文-part3 供参考——上下文感知推荐、双边公平推荐、MetaSelector、视觉主题推荐、社交影响力。 WWW2020RS_Part2、WWW2020RS_Part1

1. Eficient Non-Sampling Factorization Machines for Optimal Context-Aware Recommendation

作者:Chong Chen, Min Zhang, Weizhi Ma, Yiqun Liu, and Shaoping Ma

摘要:为了提供更准确的推荐,在对用户项目交互进行建模之外考虑上下文特征已成为一个热门话题。具有负采样的因子分解机(FM)是一种流行的上下文感知推荐解决方案。然而,由于采样可能丢失重要信息,并且在实际应用中通常会导致非最优性能,因此该算法的鲁棒性不强。最近的一些努力通过使用深度学习框架建模高阶特征交互增强了FM的性能。而他们要么只关注评分预测任务,要么通常采用负采样策略来优化排名效果。由于采样的巨大的波动,我们有理由认为这些基于采样的FM方法对于上下文感知推荐仍然不是最佳的。在本文中,我们提出在不进行采样的情况下学习FM,以有助于上下文感知推荐¬¬的排名任务。尽管这种方法效率很高,但这种非采样策略对模型的学习效率提出了很大的挑战。因此,我们进一步设计了一种新的理想框架--有效非采样样因子分解机(ENSFM)。ENSFM不仅无缝连接了FM和矩阵分解(MF)之间的关系,而且通过新颖的记忆策略解决了具有挑战性的效率问题。通过在三个真实的公共数据集上的大量实验表明:1)我们提出的ENSFM的性能一致且显著优于现有的上下文感知Top-K推荐方法,2)ENSFM在训练效率上具有显著的优势,使其更适用于实际的大系统。此外,实验结果表明,对于Top-K推荐任务,合适的学习方法比先进的神经网络结构更为重要。

网址:

http://www.thuir.cn/group/~mzhang/publications/TheWebConf2020-Chenchong.pdf

代码链接:

https://github.com/chenchongthu/ENSFM

2. FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms

作者:Gourab K Patro, Arpita Biswas, Niloy Ganguly, Krishna P. Gummadi and Abhijnan Chakraborty

摘要:我们在双边在线平台的背景下调查公平推荐(fair recommendation )问题,该平台由一边的客户和另一边的生产商组成。这些平台推荐服务的传统方法侧重于根据个人客户的个性化偏好定制结果,以实现客户满意度的最大化。然而,我们的调查显示,这种以客户为中心的设计可能会导致生产商之间曝光量的不公平分配,这可能会对他们的利益造成不利影响。另一方面,以生产商为中心的设计可能会对客户不公平。因此,我们考虑了客户和生产商之间的公平问题。我们的方法将公平推荐问题映射为一个公平分配不可分割商品问题的新颖映射。我们提出的FairRec算法可确保至少为大多数生产商提供Maximin Share(MMS)的曝光量,并为每个客户提供多达Envy-Free(EF1)的公平性。对多个真实世界数据集的广泛评估显示,FairRec在确保双面公平性的同时,在总体推荐质量方面造成了边际损失的有效性。

网址:

https://arxiv.org/pdf/2002.10764.pdf

3. MetaSelector: Meta-Learning for Recommendation with User-Level Adaptive Model Selection

作者:Mi Luo, Fei Chen, Pengxiang Cheng, Zhenhua Dong, Xiuqiang He, Jiashi Feng and Zhenguo Li

摘要:推荐系统通常面对包含高度个性化用户历史数据的异构数据集,在这些数据集中,没有哪个模型可以为每个用户提供最佳建议。我们在公共和私有数据集上都观察到了这种普遍存在的现象,并解决了模型选择问题,以追求对每个用户的推荐质量的优化。我们提出了一个元学习框架来促进推荐系统中用户级的自适应模型选择。在此框架中,我们将使用来自所有用户的数据来训练推荐者集合,然后通过元学习对模型选择器进行训练,以使用用户特定的历史数据为每个用户选择最佳的单个模型。我们在两个公共数据集和一个真实的生产数据集上进行了广泛的实验,证明了我们的框架在AUC和LogLoss方面比单一的模型基线和样本级模型选择器都有改进。特别是,当这些改进部署在在线推荐系统中时,可能会带来巨大的利润收益。

网址:

https://arxiv.org/pdf/2001.10378.pdf

4. Recommending Themes for Ad Creative Design via Visual-Linguistic Representations

作者:Yichao Zhou, Shaunak Mishra, Manisha Verma, Narayan Bhamidipati and Wei Wang

摘要:在线广告行业中经常需要更新广告创意,即用于吸引在线用户进入品牌的图像和文字。进行此类更新,是为了减少在线用户中广告疲劳的可能性,并将其他成功的广告加入到相关产品类别中。对于创意策略师来说,给定一个品牌,为一个新的广告想出主题是一个费时费力的过程。创意策略师来通常从过去广告活动中使用的图像和文字以及有关品牌的知识中汲取灵感。为了在过去的广告活动中通过此类多模态信息自动推断广告主题,我们为广告创意策略师提出了主题(关键词)推荐系统。主题推荐器基于视觉问答(VQA)任务的聚合结果,该任务提取以下内容:(i)广告图像,(ii)与广告关联的文字以及广告中品牌的Wikipedia页面,(iii)有关广告的问题。我们利用基于transformer的跨模态编码器来为VQA任务训练视觉语言表示。我们沿着分类和排序的思路研究了VQA任务的两个公式;通过在公共数据集上的实验,表明跨模态表示显著地提高了分类准确率和排序精准-召回指标。与单独的图像和文本表示相比,跨模式表示显示出更好的性能。此外,与仅使用文本或视觉信息相比,多模态信息的使用表现出显著提升。

网址:https://arxiv.org/pdf/2001.07194.pdf

5. The Structure of Social Influence in Recommender Networks

作者:Pantelis P. Analytis, Daniel Barkoczi, Philipp Lorenz-Spreen and Stefan M. Herzog

摘要:人们在品味(taste)上影响他人意见的能力各不相同-既包括离线与在线推荐系统。这些惊人差异背后的机制是什么?使用加权k最近邻算法(k-nn)表示一系列社会学习策略,我们利用网络科学的方法展示了k-nn算法如何在六个现实世界的品味领域中引发社会影响力网络。我们给出了三个新的结果,分别适用于离线建议获取和在线推荐器设置。首先,有影响力的个人具有主流品味,与其他人的品味相似性分散度很高。其次,个人或算法咨询的人越少(即k越低),或者对其他更相似的人的意见给予的权重越大,具有实质性影响的人的群体就越小。第三,对部署k-nn算法后产生的影响网络是分层组织的。我们的结果为通信和网络科学中的经典实证发现提供了新的线索,有助于提高对线下和在线上的社会影响的理解。

网址:https://www.researchgate.net/publication/338985014_The_structure_of_social_influence_in_recommender_networks

6. Latent Linear Critiquing for Conversational Recommender Systems

作者:PKai Luo, Scott Sanner, Ga Wu, Hanze Li and Hojin Yang

摘要:批判(Critiquing)是一种用于会话推荐的方法,可根据用户的偏好反馈迭代地调整建议。在该设置中,迭代地向用户提供该项目的项目推荐和属性描述;用户可以接受该推荐,或者批判项目描述中的属性以生成新的推荐。之前的批判方法主要基于显式约束和基于实用程序的方法来修改推荐(评判的项目属性)。在这篇文章中,我们回顾了基于潜在嵌入和主观项目描述(即来自用户评论的关键词)的推荐方法时代的批判方法。主要两个关键的研究问题:(1)如何将关键词批判与用户偏好嵌入一起嵌入以更新推荐,(2)如何调节多步骤批判性反馈的强度,其中批判性反馈不一定是独立的,也不一定是同等重要的。为了解决(1),我们构建了一个现有的最先进的线性嵌入推荐算法,以使基于评论的关键词属性与用户偏好嵌入保持一致。为了解决(2),我们利用嵌入和推荐预测的线性结构来建立一个基于线性规划(LP)的优化问题,以确定纳入批评反馈的最优权重。我们在两个包含模拟用户评论的推荐数据集上评估提出的框架。与对批判反馈进行平均的标准方法相比,实验结果表明,我们的方法减少了找到满意项目所需的交互次数,并提高了总体成功率。

网址:

https://ssanner.github.io/papers/www20_llc.pdf

成为VIP会员查看完整内容
0
54

【导读】国际万维网大会(The Web Conference,简称WWW会议)是由国际万维网会议委员会发起主办的国际顶级学术会议,创办于1994年,每年举办一届,是CCF-A类会议。WWW 2020将于2020年4月20日至4月24日在中国台湾台北举行。本届会议共收到了1129篇长文投稿,录用217篇长文,录用率为19.2%。近期,推荐相关也比较热门,专知小编提前整理了WWW 2020 推荐系统比较有意思的的论文,供参考——序列推荐、可解释Serendipity 推荐、推荐效率、 bandit推荐、Off-policy学习。 WWW2020RS_Part1

  1. A Contextualized Temporal Attention Mechanism for Sequential Recommendation

作者:Jibang Wu, Renqin Cai, Hongning Wang

摘要:根据用户的历史连续行为预测用户的偏好对于现代推荐系统来说是具有挑战性的,也是至关重要的。现有的序列推荐算法在建模历史事件对当前预测的影响时,大多侧重于序列行为之间的过渡结构,而很大程度上忽略了时间和上下文信息。在这篇文章中,我们认为过去的事件对用户当前行为的影响应该随着时间的推移和不同的背景而变化。因此,我们提出了一种情境时间注意力机制(Contextualized Temporal Attention),该机制可以学习权衡历史行为在行为以及行为发生的时间和方式上的影响。更具体地说,为了动态地校准来自自注意力机制的相对输入的依赖关系,我们提出了多个参数化的核函数以学习各种时间动态,然后使用上下文信息来确定每个输入要跟随哪一个kernel( reweighing kernels )。在对两个大型公开推荐数据集进行的实证评估中,我们的模型始终优于一系列最先进的序列推荐方法。

网址:

https://arxiv.org/pdf/2002.00741.pdf

  1. Directional and Explainable Serendipity Recommendation

作者:Xueqi Li, Wenjun Jiang, Weiguang Chen, Jie Wu, Guojun Wang, Kenli Li

摘要:近几年来,Serendipity推荐越来越受到人们的关注,它致力于提供既能迎合用户需求,又能开阔他们眼界的建议。然而,现有的方法通常使用标量而不是向量来度量用户与项目的相关性,忽略了用户的偏好方向,这增加了不相关推荐的风险。此外,合理的解释增加了用户的信任度和接受度,但目前没有为Serendipity推荐提供解释的工作。为了解决这些局限性,我们提出了一种有向的、可解释的Serendipity推荐方法,称为DESR。具体而言,首先采用基于高斯混合模型(GMM)的无监督方法提取用户的长期偏好,然后利用胶囊(capsule )网络捕捉用户的短期需求。然后,我们提出了将长期偏好与短期需求相结合的意外(serendipity)向量,并利用它生成有向的Serendipity推荐。最后,利用反向路径选择方案进行了解释。在真实数据集上的大量实验表明,与现有的基于意外(serendipity)发现的方法相比,DESR能够有效地提高意外性和可解释性,促进多样性。

网址 https://cis.temple.edu/~jiewu/research/publications/Publication_files/jiang_www_2020.pdf

  1. LightRec: a Memory and Search-Efficient Recommender System

作者:Defu Lian, Haoyu Wang, Zheng Liu, Jianxun Lian, Enhong Chen, Xing Xie

摘要:近年来,深度推荐系统已经取得了显着的进步。尽管具有出色的排名精度,但实际上运行效率和内存消耗在现实中却是严重的瓶颈。为了克服这两个瓶颈,我们提出了LightRec,这是一个轻量级的推荐系统,具有快速的在线推断功能和经济的内存消耗。LightRec的主干是总共B个codebooks,每个codebook均由W个潜在向量组成,称为codewords。在这种结构的顶部,LightRec将有一个商品表示为B codewords的加法组合,这些B codewords是从每个codebook中选择的最佳的。为了有效地从数据中学习codebooks,我们设计了一个端到端的学习工作流程,其中所提出的技术克服了固有差异性和多样性方面的挑战。另外,为了进一步提高表示质量,采用了几种distillation策略,可以更好地保留用户-商品的相关性得分和相对排名顺序。我们对LightRec在四个真实数据集上进行了广泛评估,得出了两个经验发现:1)与最先进的轻量级baseline相比,LightRec在召回性能方面取得了超过11%的相对改进;2)与传统推荐算法相比,在top-k推荐算法中,LightRec的精度下降幅度可以忽略不计,但速度提高了27倍以上。

网址: http://staff.ustc.edu.cn/~liandefu/paper/lightrec.pdf

  1. Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

作者:Mengyue Yang, Qingyang Li, Zhiwei Qin, Jieping Ye

摘要:上下文多臂 bandit(MAB)在各种问题上实现了优异性能。然而,当涉及到推荐系统和在线广告等现实场景时,必须考虑探索的资源消耗。在实践中,通常存在与在环境中执行建议(ARM)相关联的非零成本,因此,应该在固定的探索成本约束下学习策略。由于直接学习全局最优策略是一个NP难题,并且极大地使bandit算法的探索和开发之间的权衡复杂化,因此直接学习全局最优策略是一个很大的挑战。现有的方法着重于通过采用贪婪策略来解决问题,该策略估计预期的收益和成本,并基于每个臂的预期收益/成本比使用贪婪的选择,利用历史观察直到勘探资源耗尽为止。然而,现有的方法当没有更多的资源时,学习过程就会终止,因此很难扩展到无限的时间范围。本文提出了一种分层自适应上下文bandit方法(HATCH)来进行有预算约束的上下文bandit的策略学习。HATCH采用一种自适应的方法,根据剩余资源/时间和对不同用户上下文之间报酬分配的估计来分配勘探资源。此外,我们利用充分的上下文特征信息来找到最好的个性化推荐。最后,为了证明提出的理论,我们进行了regret bound分析,并证明HATCH的regret bound低至O(√T)。实验结果证明了该方法在合成数据集和实际应用中的有效性和效率。

网址: https://arxiv.org/pdf/2004.01136.pdf

  1. Off-policy Learning in Two-stage Recommender Systems

作者:Jiaqi Ma, Zhe Zhao, Xinyang Yi, Ji Yang, Minmin Chen, Jiaxi Tang, Lichan Hong, Ed H. Chi

摘要:许多现实世界中的推荐系统需要高度可伸缩性:将数百万个项目与数十亿用户进行匹配,并只具有毫秒级的延迟。可伸缩性的要求导致了广泛使用的两阶段推荐系统,由第一阶段高效的候选生成模型和第二阶段更强大的排序模型组成。通常使用记录的用户反馈(例如,用户点击或停留时间)来构建用于推荐系统的候选生成和排名模型。虽然很容易收集大量这样的数据,但因为反馈只能在以前系统推荐的项目上观察到,因此这些数据在本质上是有偏见的。近年来,推荐系统研究领域对此类偏差的off-policy 修正引起了越来越多的关注。然而,现有的大多数工作要么假设推荐系统是一个单阶段系统,要么只研究如何将离策略校正应用于系统的候选生成阶段,而没有显式地考虑这两个阶段之间的相互作用。在这项工作中,我们提出了一种两阶段离策略(two-stage off-policy)策略梯度方法,并证明了在两阶段推荐系统中忽略这两个阶段之间的交互会导致次优策略。该方法在训练候选生成模型时明确考虑了排序模型,有助于提高整个系统的性能。我们在具有大项目空间的真实数据集上进行了实验,验证了所提方法的有效性。

网址: http://www.jiaqima.com/papers/OP2S.pdf

成为VIP会员查看完整内容
0
64

【导读】国际万维网大会(The Web Conference,简称WWW会议)是由国际万维网会议委员会发起主办的国际顶级学术会议,创办于1994年,每年举办一届,是CCF-A类会议。WWW 2020将于2020年4月20日至4月24日在中国台湾台北举行。本届会议共收到了1129篇长文投稿,录用217篇长文,录用率为19.2%。上周专知小编提前整理了WWW 2020图神经网络(GNN)比较有意思的的论文,这期小编继续为大家奉上WWW 2020推荐相关论文供参考! WWW2020GNN

  1. Correcting for Selection Bias in Learning-to-rank Systems

作者:Zohreh Ovaisi, Ragib Ahsan, Yifan Zhang, Kathryn Vasilaky and Elena Zheleva

摘要:现代推荐系统收集到的点击数据是用来训练学习排名(LTR)系统的观察数据的重要来源。然而,这些点击数据会受到许多偏差(bias)的影响,这些偏差可能会导致LTR系统的性能变差。在此类系统中,最近的偏差校正(bias correction)方法主要集中在位置偏差上,即虽然不是用户查询最相关的,但排名较高的结果(例如,顶级搜索引擎结果)更可能被点击。由于所点击的文档反映了什么文档首先向用户展示,因此大部分方法对校正选择偏差的关注较少。在本文中,我们提出了新的方法,这些方法可以适应Heckman的两阶段方法,并考虑LTR系统中的选择偏差和位置偏差。我们的实验评估表明,与现有的无偏LTR算法相比,我们提出的方法对噪声的鲁棒性更高,并且具有更好的准确性,尤其是在存在中度偏差到无位置偏差的情况下。

网址: https://arxiv.org/abs/2001.11358

  1. Efficient Neural Interaction Function Search for Collaborative Filtering

作者:Quanming Yao, Xiangning Chen, James T. Kwok, Yong Li and Cho-Jui Hsieh

摘要:在协同过滤(CF)中,交互函数(IFC)扮演着捕获项目和用户之间交互的重要角色。最流行的交互函数(IFC)是内积,它已经成功地应用于低阶矩阵分解。然而,现实世界应用中的交互可能非常复杂。因此,可以提供更好性能的操作(例如:串联和级联)被提出。然而,现有的IFC仍然很难在不同的应用场景中保持一致的良好性能。受AutoML的启发,本文提出在CF中寻找简单神经交互函数(SIF)。通过对现有CF方法的研究和推广,设计了一种具有表现力的SIF搜索空间,并将其表示为结构化的多层感知机。我们提出了一种one-shot搜索算法,可以同时更新体系结构和学习参数。 实验结果表明,所提出的方法比流行的AutoML方法效率更高,比最新的CF方法可以获得更好的预测性能,并且可以针对不同的数据集和任务发现不同的IFC。

网址: https://arxiv.org/abs/1906.12091

  1. Influence Function based Data Poisoning Attacks to Top-N Recommender Systems

作者:Minghong Fang, Neil Zhenqiang Gong and Jia Liu

摘要:推荐系统是Web服务中吸引用户的重要组成部分。流行的推荐系统使用大量众包用户-项目交互数据(例如评级得分)对用户偏好和项目属性进行建模;然后,将与用户偏好最匹配的前N个项目推荐给用户。在这项工作中,我们展示了攻击者可以通过向虚假用户注入精心制作的用户-项目交互数据,对推荐系统发起数据中毒攻击,从而按照攻击者的意愿进行推荐。具体地说,攻击者可以诱导推荐系统向尽可能多的普通用户推荐目标项目。我们关注已经在行业中得到了广泛的应用的基于矩阵分解的推荐系统。给定攻击者可以注入的虚假用户数量,我们将虚假用户评分的制定过程描述为一个优化问题。但是,该优化问题是一个非凸整数规划问题,求解起来很有挑战性。为了解决这一挑战,我们开发了几种技术来近似解决优化问题。例如,我们利用影响函数(influence function)来选择对推荐有影响力的普通用户子集,并基于这些有影响力的用户来解决我们制定的优化问题。实验结果表明,我们的攻击是有效的,并且优于现有的方法。

网址: https://arxiv.org/abs/2002.08025

  1. Learning Multi-granular Quantized Embeddings for Large-Vocab Categorical Features in Recommender Systems

作者:Wang-Cheng Kang,Derek Zhiyuan Cheng, Ting Chen, Xinyang Yi, Dong Lin, Lichan Hong and Ed H. Chi

摘要:推荐系统模型通常通过嵌入来表示像用户、项目和分类特征这类的稀疏特征。标准方法是将每个唯一的特征值映射为嵌入向量。所产生的嵌入表的大小随着词汇表的大小线性增长。因此,大词汇量不可避免地会导致巨大的嵌入表,从而产生两个严重的问题:(I)使服务于资源紧张环境中的模型变得难以处理;(ii)造成过拟合的问题。在本文中,我们致力于学习用于推荐系统(recsys)中大型词汇稀疏特征的高度简洁的嵌入。首先,我们证明了新的可微积量化( Differentiable Product Quantization,DPQ)方法可以推广到Recsys问题。此外,为了更好地处理Recsys中常见的幂律数据分布,我们提出了一种多粒度量化嵌入(MGQE)技术,该技术对不频繁的项目学习更简单的嵌入。我们尝试以简单的模型规模为提高推荐性能提供一个新的角度。在三个推荐任务和两个数据集上的大量实验表明,我们可以用原始模型规模的20%的模型获得与原模型相当甚至更好的性能。

网址: https://arxiv.org/abs/2002.08530

  1. Beyond Clicks: Modeling Multi-Relational Item Graph for Session-Based Target Behavior Prediction

作者:Wen Wang, Wei Zhang, Shukai Liu, Bo Zhang, Leyu Lin and Hongyuan Zha

摘要:基于会话的目标行为预测旨在预测要与特定行为类型(例如,点击)进行交互的下一个项目。虽然现有的基于会话的行为预测方法利用强大的表示学习方法来编码项目在低维空间中的顺序相关性,但是它们受到一些限制。首先,它们侧重于只利用同一类型的用户行为进行预测,而忽略了将其他行为数据作为辅助信息的潜力。当目标行为稀疏但很重要(例如,购买或共享物品)时,这一点尤为重要。其次,项目到项目的关系是在一个行为序列中单独和局部建模的,缺乏一种规定的方法来更有效地全局编码这些关系。为了克服这些局限性,我们提出了一种新的基于会话的目标行为预测的多关系图神经网络模型MGNN-SPred。具体地说,我们基于来自所有会话的所有行为序列(涉及目标行为类型和辅助行为类型)构建多关系项目图(Multi-Relational Item Graph,MRIG)。在MRIG的基础上,MGNN-SPred学习全局项目与项目之间的关系,进而获得用户偏好。即分别为当前目标行为序列和辅助行为序列。最后,MGNN-SPred利用门控机制自适应地融合用户表示,以预测与目标行为交互的下一项目。在两个真实数据集上的广泛实验证明了MGNN-SPred与最新的基于会话的预测方法相比的优越性,验证了利用辅助行为和基于MRIG学习项目到项目关系的优点。

网址: https://arxiv.org/abs/2002.07993

  1. Towards Detection of Subjective Bias using Contextualized Word Embeddings

作者:Tanvi Dadu, Kartikey Pant and Radhika Mamidi

摘要:主观偏见检测(Subjective bias detection)对于宣传检测、内容推荐、情感分析和偏见消除等应用至关重要。这种偏见是在自然语言中通过煽动性的词语和短语引入的,使人对事实产生怀疑,并预设事实。在这项工作中,我们在维基中立性语料库(WNC)上使用基于BERT的模型进行了全面的主观偏见检测实验。数据集为36万个来自维基百科并删除了各种偏见的标记实例组成。我们进一步提出了基于BERT的集成,其性能优于BERT_large之类的最新方法5.6 F1 score。

网址: https://arxiv.org/abs/2002.06644

成为VIP会员查看完整内容
0
54

元学习的研究越来越受到学者们的重视,从最初在图像领域的研究逐渐拓展到其他领域,目前推荐系统领域也出现了相关的研究问题,本文介绍了5篇基于元学习的推荐系统相关论文,包括用户冷启动推荐、项目冷启动推荐等。

  1. MeLU: Meta-Learned User Preference Estimator for Cold-Start Recommendation

本文提出了一种新的推荐系统,解决了基于少量样本物品来估计用户偏好的冷启动问题。为了确定用户在冷启动状态下的偏好,现有的推荐系统,如Netflix,在启动初向用户提供物品选择,我们称这些物品为候选集。然后根据用户选择的物品做出推荐。以往的推荐研究有两个局限性:(1) 只有少量物品交互行为的用户推荐效果不佳,(2) 候选集合不足,无法识别用户偏好。为了克服这两个限制,我们提出了一种基于元学习的推荐系统MeLU。从元学习中,MeLU可以通过几个例子快速地应用于新任务,通过几个消费物品来估计新用户的偏好。此外,我们提供了一个候选集合选择策略,以确定自定义偏好估计的区分项目。我们用两个基准数据集对MeLU进行了验证,与两个对比模型相比,该模型的平均绝对误差至少降低了5.92%。我们还进行了用户研究实验来验证选择策略的有效性。

  1. Meta-Learning for User Cold-Start Recommendation 冷启动问题是对实际推荐系统的长期挑战。大多数现有的推荐算法依赖于大量的观测数据,对于很少交互的推荐场景来说是脆弱的。本文用少样本学习和元学习来解决这些问题。我们的方法是基于这样一种见解,即从几个例子中有一个很好的泛化,依赖于一个通用的模型初始化和一个有效的策略来使这个模型适应新出现的任务。为了实现这一点,我们将场景指定的学习与模型无关的序列元学习结合起来,并将它们统一到一个集成的端到端框架中,即场景指定的序列元学习者(或s^2 Meta)。我们的元学习器通过聚合来自各种预测任务的上下文信息来生成一个通用的初始模型,同时通过利用学习到的知识来有效地适应特定的任务。在各种现实世界数据集上的实验表明,我们提出的模型可以在在线推荐任务中获得对冷启动问题的最好效果。

  2. Sequential Scenario-Specific Meta Learner for Online Recommendation

冷启动问题是对实际推荐系统的长期挑战。大多数现有的推荐算法依赖于大量的观测数据,对于很少交互的推荐场景来说是脆弱的。本文用少样本学习和元学习来解决这些问题。我们的方法是基于这样一种见解,即从几个例子中有一个很好的泛化,依赖于一个通用的模型初始化和一个有效的策略来使这个模型适应新出现的任务。为了实现这一点,我们将场景指定的学习与模型无关的序列元学习结合起来,并将它们统一到一个集成的端到端框架中,即场景指定的序列元学习者(或s^2 Meta)。我们的元学习器通过聚合来自各种预测任务的上下文信息来生成一个通用的初始模型,同时通过利用学习到的知识来有效地适应特定的任务。在各种现实世界数据集上的实验表明,我们提出的模型可以在在线推荐任务中获得对冷启动问题的最好效果。

  1. A Meta-Learning Perspective on Cold-Start Recommendations for Items 矩阵分解(M F)是最流行的项目(item)推荐技术之一,但目前存在严重的冷启动问题。项目冷启动问题在一些持续输出项目的平台中显得特别尖锐(比如Tweet推荐)。在本文中,我们提出了一种元学习策略,以解决新项目不断产生时的项目冷启动问题。我们提出了两种深度神经网络体系结构,实现了我们的元学习策略。第一个体系结构学习线性分类器,其权重由项目历史决定,而第二个体系结构学习一个神经网络。我们评估了我们在Tweet推荐的现实问题上的效果,实验证明了我们提出的算法大大超过了MF基线方法。

  2. One-at-a-time: A Meta-Learning Recommender-System for Recommendation-Algorithm Selection on Micro Level

推荐算法的有效性通常用评价指标来评估,如均方根误差、F1或点击率CTR,在整个数据集上计算。最好的算法通常是基于这些总体度量来选择的,然而,对于所有用户、项目和上下文来说并没有一个单独的最佳算法。因此,基于总体评价结果选择单一算法并不是最优的。在本文中,我们提出了一种基于元学习的推荐方法,其目的是为每个用户-项目对选择最佳算法。我们使用MovieLens 100K和1m数据集来评估我们的方法。我们的方法(RMSE,100K:0.973;1M:0.908)没有优于单个的最佳算法SVD++(RMSE,100k:0.942;1M:0.887)。我们还探索了元学习者之间的区别,他们在每个实例(微级别),每个数据子集(中级)和每个数据集(全局级别)上进行操作。评估表明,与使用的总体最佳算法相比,一个假设完美的微级元学习器将提高RMSE 25.5%。

成为VIP会员查看完整内容
0
70

【导读】自然语言处理国际顶级会议EMNLP 2019于11月3日至11月7日在中国香港举行。为了带大家领略高质量论文,专知小编特意整理了六篇EMNLP 2019GNN相关论文,并附上论文链接供参考——命名实体识别、情感分类、对话图卷积网络、数据生成文本、短文本分类、Aspect-level情感分类等。

1、A Lexicon-Based Graph Neural Network for Chinese NER

作者:Tao Gui, Yicheng Zou, Qi Zhang;

摘要:递归神经网络(RNN)用于中文命名实体识别(NER)中,能够对文字信息进行顺序跟踪,取得了很大的成功。然而,由于链式结构的特点和缺乏全局语义,基于RNN的模型容易产生歧义。本文试图通过引入一种全局语义的基于词典的图神经网络来解决这一问题,该网络利用词典知识连接字符来捕获局部成分,而全局中继节点则可以捕获全局句子语义和长距离依赖。基于字符、潜在单词和整个句子语义之间的多重交互,可以有效地解决单词歧义。在4个NER数据集的实验表明,该模型与其他基线模型相比有显著的改进。

网址:

http://qizhang.info/paper/emnlp-2019.ner.pdf

2、Aspect-based Sentiment Classification with Aspect-specific Graph Convolutional Networks

作者:Chen Zhang, Qiuchi Li, Dawei Song;

摘要:注意机制和卷积神经网络(CNNs)由于其固有的方面和上下文词的语义对齐能力,被广泛应用于基于方面的情感分类。然而,这些模型缺乏一种机制来解释相关的句法约束和长距离的词语依赖,因此可能会错误地将句法无关的上下文词作为判断方面情绪的线索。为了解决这个问题,我们提出在句子的依存树上建立一个图卷积网络(GCN),以利用句法信息和词的依存关系。在此基础上,提出了一种新的面向方面的情感分类框架。在三个基准集合上的实验表明,我们所提出的模型比一系列最先进的模型更具有相当的有效性,并且进一步证明了图卷积结构能够恰当地捕获语法信息和长距离字的依赖关系。

网址: https://www.zhuanzhi.ai/paper/c995fe87d66236f1a22ba1c861647085

3、DialogueGCN A Graph Convolutional Neural Network for Emotion Recognition in Conversation

作者:Deepanway Ghosal, Navonil Majumder, Soujanya Poria, Niyati Chhaya, Alexander Gelbukh;

摘要:会话情感识别(ECC)由于其在医疗、教育、人力资源等多个领域的广泛应用,近年来受到了研究者的广泛关注。在本文中,我们提出了对话图卷积网络(DialogueGCN),基于图神经网络的ERC方法。我们利用对话者的自言和对话人之间的依赖关系来为情绪识别建立会话环境模型。DialogueGCN通过图形网络解决了当前基于RNN的方法中存在的上下文传播问题。我们经验表明,这种方法缓解了这样的问题,同时在一些基准的情绪分类数据集上超过了目前的状态。

网址:https://www.zhuanzhi.ai/paper/d1c2ea04a1170cd5a5541f606186a125

4、Enhancing AMR-to-Text Generation with Dual Graph Representations

作者:Leonardo F. R. Ribeiro, Claire Gardent, Iryna Gurevych;

摘要:基于图的数据生成文本,如抽象意义表示(AMR),是一个具有挑战性的任务,因为如何正确地对具有标记边的图的结构进行编码存在固有的困难。为了解决这一难题,我们提出了一种新的图-序列模型,该模型对AMR图中包含的结构信息的不同但互补的透视图进行编码。该模型学习节点的自顶向下和自下而上的并行表示,以捕获图的对比视图。我们还研究了不同节点消息传递策略的使用,使用不同的最先进的图形编码器来计算基于传入和传出透视图的节点表示。在我们的实验中,我们证明了对偶图表示法可以改进AMR到文本的生成,从而在两个AMR数据集上取得了最先进的效果。

网址: https://arxiv.org/abs/1909.00352

5、Heterogeneous Graph Attention Networks for Semi-supervised Short Text Classification

作者:Linmei Hu, Tianchi Yang, Chuan Shi, Houye Ji, Xiaoli Li ;

摘要:短文本分类在新闻和推特标记中得到了丰富而重要的应用,以帮助用户查找相关信息。由于在许多实际用例中缺乏标记的训练数据,因此迫切需要研究半监督短文本分类。现有的研究大多集中在长文本上,由于标记数据的稀疏性和局限性,在短文本上的表现不尽人意。本文提出了一种新的基于异构图神经网络的半监督短文本分类方法,该方法充分利用了标记数据少和未标记数据大的优点,实现了信息在图上的传播。特别是,我们提出了一种灵活的HIN(异构信息网络)框架,用于建模短文本,它可以集成任何类型的附加信息,并捕获它们之间的关系来解决语义稀疏性。然后,我们提出了基于节点级和类型级注意的双重注意机制的异构图注意网络(HGAT)嵌入HIN进行短文本分类。注意机制可以学习不同相邻节点的重要性,以及不同节点(信息)类型对当前节点的重要性。大量的实验结果表明,我们提出的模型在6个基准数据集上的性能显著优于最先进的方法。

网址: http://shichuan.org/doc/74.pdf

6、Syntax-Aware Aspect Level Sentiment Classification with Graph Attention Networks

作者:Binxuan Huang, Kathleen M. Carley ;

摘要:Aspect-level情感分类旨在识别向上下文语句给出的aspect表达的情绪。以往的基于神经网络的方法在很大程度上忽略了句子的句法结构。在本文中,我们提出了一种新的目标依赖图注意力网络(TD-GAT)来进行方面层次的情感分类,该网络明确利用了词语之间的依赖关系。使用依赖图,它直接从一个方面目标的语法上下文传播情感特征。在我们的实验中,我们证明了我们的方法优于使用GloVe嵌入的多个基线。我们还证明了使用BERT表示可以进一步显著地提高性能。

网址:

https://www.zhuanzhi.ai/paper/f1eb3b3fe03a1b84427aaebb68021054

成为VIP会员查看完整内容
0
61
小贴士
相关论文
Memory Augmented Graph Neural Networks for Sequential Recommendation
Chen Ma,Liheng Ma,Yingxue Zhang,Jianing Sun,Xue Liu,Mark Coates
12+阅读 · 2019年12月26日
Wenqi Fan,Yao Ma,Qing Li,Yuan He,Eric Zhao,Jiliang Tang,Dawei Yin
15+阅读 · 2019年11月23日
Sequential Scenario-Specific Meta Learner for Online Recommendation
Zhengxiao Du,Xiaowei Wang,Hongxia Yang,Jingren Zhou,Jie Tang
15+阅读 · 2019年6月2日
Next Item Recommendation with Self-Attention
Shuai Zhang,Yi Tay,Lina Yao,Aixin Sun
5+阅读 · 2018年8月25日
Jeremy Barnes,Roman Klinger,Sabine Schulte im Walde
8+阅读 · 2018年6月13日
Kuan Liu,Xing Shi,Prem Natarajan
3+阅读 · 2018年5月28日
Maartje ter Hoeve,Anne Schuth,Daan Odijk,Maarten de Rijke
5+阅读 · 2018年5月14日
Georgios Alexandridis,Georgios Siolas,Andreas Stafylopatis
8+阅读 · 2018年1月10日
Han Xiao,Lian Meng,Minlie Huang,Xiaoyan Zhu
6+阅读 · 2017年12月2日
Jing Li,Pengjie Ren,Zhumin Chen,Zhaochun Ren,Jun Ma
5+阅读 · 2017年11月13日
Top
微信扫码咨询专知VIP会员