A Survey on Deep Learning Based Point-Of-Interest (POI) Recommendations

A Survey on Deep Learning Based Point-Of-Interest (POI) Recommendations

和君君一起读论文之- A Survey on Deep Learning Based Point-Of-Interest (POI) Recommendations

摘要

基于位置的社交网络(LBSNs)允许用户通过分享check-in、观点、照片和评论等信息,与朋友和家人进行交互。LBSNs生成的大量数据开辟了新的研究途径,并催生了推荐系统的新子领域,即兴趣点(Point-of-Interest, POI)推荐。POI推荐技术本质上是利用用户的历史check-in和其他多模态信息,如POI属性和友谊网络,来推荐适合用户的下一组POI。过多的早期工作集中于传统的机器学习技术,使用手工制作的特征,从数据集。随着最近深度学习研究的兴起,我们见证了大量使用不同深度学习范式的POI推荐工作。这些技术在问题的公式、提出的技术、使用的数据集和特征等方面有很大的不同。据我们所知,这项工作是第一次全面调查所有主要的基于深度学习的POI推荐工作。我们的工作基于不同的深度学习范式和其他相关特征,对最近的POI推荐工作进行分类和批判性分析。这篇综述可以被认为是在POI推荐领域工作的研究人员或从业人员的一个基础。

Introduction

LBSNs为用户提供了通过分享历史签入。位置和评价的独特的社交方式。所有的优势和智能手机的广泛使用是相辅相成的。动态的增加了数十亿规模的基于位置的社交网络平台。早期的POI推荐工作主要集中在特征工程和传统(非深度学习)基于机器学习的方法。基于马尔可夫链的随机模型在这方面得到了广泛的研究[1,2,3,4,5,6,7,8,9]。由于基于矩阵分解(MF[10])的推荐系统方法的成功在其他领域。MF方法[11,12,13,2,14,15,16,17]也被研究用于更好的POI推荐建模。为了获得比香草MF方法更好的性能,我们采用了贝叶斯个性化排序(BPR[18])方法[19,20,21,22,23,24,25,8]。其他传统的方法如支持向量机[26]、协同过滤[27,28,29,30,31,32]、高斯建模[33]、传递不相似[34]等也被应用于不同的POI个性化推荐工作中。所有这些方法的一个主要缺点在于特性工程。明确的特性工程需要足够的领域专业知识。

深度学习方法如卷积神经网络(CNN)或递归神经网络(RNN)在自动特征提取方面提供了许多优势,消除了手工特征设计的困难。此外,基于深度学习的方法在结构化和非结构化数据之间的复杂关系建模方面具有优势,这使得我们可以在POI推荐中利用来自不同领域的多模态数据。在过去的几年中,我们看到了在所有主要场所(如AAAI、IJCAI、SIGIR、CIKM、WWW等)利用深度学习推荐POI的作品数量前所未有的增长。使用不同的深度学习模型,例如CNN,RNN,LSTM,GRU和self-attention已经大大的提高了POI推荐模型的性能。除此之外,还有来自自然语言的最先进的技术,在POI推荐中,人工神经网络(NLP)也被用于复杂的人体移动性建模。最近的一些研究利用图嵌入来丰富语义地理空间信息模型[50,51,52]。在很短的时间内引入了各种基于深度学习的POI推荐技术,因此有必要对这些工作进行全面的回顾(i)来演示如何使用不同的技术来处理不同的特性,(ii)确定每个模型的优缺点,(iii)提出潜在差距和未来研究机会的总结指南.赵等人把POI推荐分类成为三种:基于影响因素、基于方法和基于任务。

论文贡献:1.从应用的角度进行了分类;
2.分析不同数据集的特点以及使用的领域,描述数据集的优点和缺点
3.讨论基于深度学习的POI推荐系统,比较算法之间的优缺点。
4.区分不同的因素对POI推荐和提供不同的图表信息。
5.基于这些算法的性能指标,对不同的算法进行比较。
6.区分不同现在工作的缺点,提供未来POI推荐的需求。

问题定义:

POI推荐是一类通过历史信息预测未来用户POI的问题,历史信息包括check-in记录和其他相关数据。U = {{u_1,u_2,...u_n}}表示LBSN中有N个用户。P = {p_1,p_2,...,p_M}表示有M个POI位置。用户之间形成连接关系,表示为\ddot{U} = {<u_i, u_j> \vert {u_i,u_j \in U}}.POI中的P是由纬度x_p和经度y_p组成的。属性W_p表示POI的语义属性。

  • 定义1: check-in
    一个check-in \rho_{t_i}^u表示用户Ut_i时刻的POI
  • 定义2:check_in 列表:
    每一个用户U与check-ins相关,check-ins C^u = {\rho_{t_1}^u,\rho_{t_2}^u,...,\rho_{t_T}^u},其中\rho_{t_i}^u表示一个check-in记录,1<=i<=T.
  • 定义3:下一个POI推荐:
    用户u的check-in的list是C^u,下一个POI推荐目的是预测下一个时间t_{T+1}的POI。
  • 定义4:POI推荐序列
    用户U的check-in序列预测,是预测接下来n个POIs,其中时间是从t_{T+1}t_{T+n}
  • 定义5: check-in序列, C^u = {\rho_{t_1}^u,\rho_{t_2}^u,\rho_{t_m}^u,\rho_{t_{m+1}}^u...,\rho_{t_T}^u},如果\rho_{t_m}^u丢失POI信息需要在t_m时间预测得到。

网络结构预备知识

在本节中,我们将介绍不同的深度神经网络范式的初步概述,包括前馈网络、卷积神经网络、循环神经网络、长-短期记忆、门控循环单元、注意机制和生成对抗网络。

前馈神经网络

前馈神经网络FFN,卷积神经网络CNN,循环神经网络RNN,长短记忆神经网络LSTM,注意力机制,对抗神经网络

数据描述

在POI推荐中,用户check-in数据集是通过Foursquare, Gowalla, Yelp, Twitter, Facebook, Brightkite, Instagram, WeChat, and Baidu Map收集到的。这些数据集基本上都是扁平化的数据。主要是记录用户-POI和用户-用户之间的关系。

User-POI数据主要包含用户的check-in信息包括:时间戳,位置和语义信息。其中POI信息包括:poi和标记的类别,POI的创建时间,地理位置(经度、纬度),check-in 数量,check-in 用户数量、半径等。另一方面用户的信息包含:post个数,邻居,check-ins等。为了保留一些社会属性,像Foursquare, Gowalla, Weeplace这样的数据集也包含了一个多对多模式的用户-用户关系,每个用户都与他所有的邻居相连。这些数据都非常巨大。因此,以前的大多数工作都集中在一个特定的地区或国家,以保持规模易于处理。以下是对LBSN数据集的简要讨论:

Foursquare: foursquare成立于2009年,致力于在全球范围内收集和分发位置数据,为科技公司和品牌提供便利。本文中讨论的大多数POI推荐模型都使用了Foursquare 2010年至2014年的数据集。数据集包含主要来自美国和东京的check-in数据。该数据集还包含LBSN中每个用户的所有好友列表。

Gowalla: Gowalla是一个基于位置的社交媒体平台,致力于位置签到。该平台成立于2007年,2012年被Facebook收购。Gowalla最初是一个移动应用程序,允许用户使用移动设备查看他们所访问的地点。Gowalla运行期间的数据集可以通过Gowalla API获得,目前,这些数据集还没有官方的分销商。Gowalla是本文讨论的POI推荐模型中使用第二多的数据集。之前讨论的大部分工作都使用了2009年2月至2010年10月的入住数据。和Foursquare一样,Gowalla数据集也包含了数据集中每个用户的朋友列表。此外,该数据集中还提供了每个POI和用户配置文件的详细描述。

Brightkite: Brightkite是一个基于位置的社交媒体网络,成立于2007年,2012年解散。该平台提供了在访问一个地点后通过短信或移动应用程序check-in的能力。Brightkite的数据集已不再正式可用,但仍然可以从全球各地的各种研究档案中获取。

Yelp: Yelp^2是另一个流行的LBSN平台。由于用户倾向于在不同的商业地点check-in,Yelp提供了来自分享自己经历的顾客的评论和评级,这既是出于个人目的,也是出于研究目的。Yelp成立于2004年,至今仍是一家商业机构的评估公司。POI推荐模型极大地受益于Yelp的文本评论,因为评论提供了POI的语义信息。

Weeplaces: WeePlaces是一种基于位置服务的可视化地图服务。Weeplaces已经与Gowalla和Facebook整合在一起,用户可以通过Foursquare、Gowalla和Facebook Places向好友显示自己的位置。与Foursquare和Gowalla数据集一样,Weeplace数据集也包含与用户相关的朋友列表,可以在POI推荐中获取社交影响力。
Instagram: Instagram 3是一个社交媒体平台,最初于2010年发布,目前由Facebook所有。Instagram允许用户在网上发布和分享照片和视频。用户可以通过标签和位置浏览其他用户的内容。Instagram数据集主要包含用户check-in数据,最近在POI推荐方面的一些工作中已经使用了这些数据。

Twitter: Twitter 4是一个非常流行的社交媒体平台,用户可以在这里发布、查看和分享被称为tweets的短消息。Twitter成立于2006年,是目前世界上最受欢迎的微博服务。Twitter的check-in功能允许用户记录访问地点。这些数据集可以通过Twitter公共API获得。

Other datasets: 一些其他使用的数据集收集自微信5,百度地图6,Facebook7。微信的功能包括短信、语音信息、视频会议和位置共享。百度地图提供街道地图和视图,地形的卫星视图,以及旅行路线规划者。Facebook是目前最大的社交媒体网站,用户可以发布文本、照片和多媒体来分享自己的信息。帖子可以包含一个参观过的地方的签到信息,因此Facebook的数据集可以正式用于POI预测研究。

table 2


POI推荐模型

本文主要分类了目前所有的提到的模型,目前为止主要有六类:RNN为基础POI推荐;基于LSTM;基于GRU;基于GE;基于GAN。

5.1 RNN based models

由于POI推荐与NLP的任务相似,所以可以使用RNN来完成任务。ST-RNN将RNN模型扩展到,获取时间-空间影响。这篇文章增加了时间特征和距离特征的过渡矩阵,目的是为了捕获时间循环影响和空间影响。该模型还采用线性插值的方法对转换矩阵进行训练。Flashback模型通过稀疏用户信息,将关注点放在时空和上下文关系上,同时对RNN的隐藏状态进行了返回操作。此外,该模型对历史隐藏状态使用权重平均方法,这样做能够更好的捕获时空影响。此外,本文还利用用户嵌入来考虑用户的偏好。ASPPA模型主要学习了check-in序列的潜在结构。主要是将ASP和RNN进行结合实现模型。本文旨在自动检测和识别poi的各个语义子序列,并发现其序列模式。模型堆叠多个RNN,并且使用PA来整合时空上下文特征输入到模型中。输出层是两个全连接层和一个drop-out层。LLRec: 主要解决一些类似隐私安全的弊端,减轻模型的训练开销。该模型使用学生-老师模型。训练模型也就是老师模型在云服务器上进行。学生模型,就直接加载云服务器上预训练好的模型,实现预测。用户可以直接通过预训练模型获得POI推荐。为了继续减轻手机上模型预测的计算开销,使用tensor-train进一步压缩预训练模型。此外,还是用了只是蒸馏模块用于提高预测精度。时间空间转移矩阵用于计算时空相关性。

5.2 LSTM based models

由于RNN不能获取长时间依赖关系,所以使用LSTM方法实现POI推荐模型就产生了。一般采用encoder-decoder模型。encoder用于获取用户checks-in信息和其他属性。decoder可以预测下一个POI或者一个序列的POI信息。

HST-LSTM 使用分层模型来编码人们移动的周期性。然后使用encoder-decoder模型实现POI推荐。TMCA 使用基于encoder-decoder结构的LSTM模型,该模型中有三种attention结构。不同维度的上下文attention(局部和全局)以及时间attention。LSPL主要是抓住长短时间关系。长时间依赖关系主要使用embedding和attention来抓住长期时间依赖关系。短时间的时空依赖关系是由两层分开的LSTM完成,然后将长短期时间依赖关系进行合并,用来预测下一个POI,PLSPL在lspl上增加了用户维度。ASTEN对POI进行了编码,使用LSTM和attention机制完成对时间空间和地理结构上的编码。 LSTPM是基于LSTM模型的,该模型将check-in分成了多个轨迹,该模型也是使用了三个模块:长时间偏好模型,短时间偏好模型,和预测模型,长时间偏好模型使用所有的轨迹数据,短时间偏好模型使用的上一个轨迹数据,然后将这两个模块结合,来预测下一个POI。该模型有一个缺点就是,该模型不能够找到不连续的两个POIs之间的关系。为了捕捉这种影响,模型在短期偏好建模中使用了地理扩展LSTM方案和基本LSTM。iMTL使用了两个通道编码和一个解码。两个通道的编码是temporal-aware activity和spatial-aware location编码,目的是捕获the sequential correlations of activities 和位置偏好。LSTM编码的表示被用于特定任务的解码器来交互执行预测任务。这篇论文的一个新颖贡献是他们关注collective poi。 一般的POI推荐工作,仅仅是预测局部POI,忽略了时间戳,但是CatDM该模型可以预测用户在未来24小时内访问的poi。(1)metric嵌入学习用户、POI、POI类别和时间的潜在特征(2)第一个深度编码器捕获POI类别中的用户偏好(3)两个过滤器用于减少搜索空间以生成候选项(4)另一个用于poi中用户偏好的深度编码器,以及(5)用于对候选集进行排序的模块。对于候选集的排序,该模型同时考虑了用户与POI的相关性、用户与POI类别的相关性、POI与时间影响的相关性、POI与用户当前偏好的相关性。该模型利用POI类别和地理影响来克服数据稀疏性。该模型还使用了一种注意力机制来获得更好的结果。大多数现有的POI推荐方法仅捕捉序列的规律性。但是对于常见的转移规律却没有考虑在内,ARNN同时捕获了空间和转移规律相关性,同时解决了稀疏问题。(1)邻居发现层:利用知识图(KG)和元路径从异构数据中提取邻居;(2)嵌入层:将签入序列的稀疏特征转化为密集表示,利用多模态嵌入层学习时空特征、语义上下文;(3)注意层:计算当前位置与每个邻居的相似度,捕捉邻居的过渡规律;(4)递归层:利用LSTM捕获高阶序列规律.

5.3 Bi-LSTM

普通LSTM只按顺序处理一个方向的输入。虽然它可以帮助模型从前面的输入中获得连续的信息,但是不能从后面的输入部分获取信息。双向LSTM (Bi-LSTM)通过考虑两个输入方向来解决这一问题。一些最近的POI推荐模型也使用Bi-LSTM从两个方向捕获序列特征,以获得更好的性能。

从GeoIE模型中我们发现,POI具有两种倾向:(1)地理影响:引导其用户到其他POI位置;(2)地理敏感性:接收来自其他POI的访客影响。GT-HAN由于不同poi间的地理协同影响差异较大,该模型处理了三种因素:受地理位置影响的POI;受地理敏感性的POI,以及语义信息的POI。通过使用attention网络,探索POI地理关系和check-list的时间关系来完成POI推荐任务。t-LocPred 使用两个基本模块,第一个模块是由CNN和ConvLSTM层层,捕获相邻兴趣点理解矩阵之间的关系,时间上分别学习了一天和一周。第二个模块,使用spatial-aware记忆模块来增广LSTM,加上时间相关的attention机制,共同捕获复杂的长时间依赖关系,也能够更细粒度的预测用户未来可能访问的POI。CAPRE主要是利用完整的POI推荐模块。输入历史check-in数据,内容编码层:使用CNN+多头注意力+POI嵌入,捕获用户对POI各个角度的感兴趣程度。用户行为:使用Bi-LSTM,输出是多个MLP来完成预测。

5.4 魔改LSTM

一些模型对基本的LSTM模型进行了修正,以增强POI预测。其基本思想是通过修改基本的LSTM来更好地捕获用户的短期和长期偏好。

STGN该模型修改了基本的LSTM,在原来基础上增加了四个新的门控设置。两个长期门控和两个短期门控。也增加了细胞状态用于长短期依赖关系门控。未来还可以继续进行修改。

5.6 GRU

大多数模型都考虑了不同类型的上下文对用户偏好的相同影响。但它们的影响并不相同。CARA 有四层,输入层,嵌入层,循环层,输出层。通过两个门控设置来完成上下文对用户的不同影响。(1)CAG:控制普通上下文和过渡上下文对用户动态偏好的影响(2)TSG:考虑连续签入之间的时间间隔和地理距离,控制前一个GRU单元隐藏状态的影响。

GE

一些最近的技术利用了图嵌入(GE)的潜力,学习了数据空间的低维关键特征,建模为不同形式的图,如POI-POI、用户poi和POI-time。poi-poi捕获顺序,POI-Region捕获地理影响,POI-Time捕获时间循环,POI-Word捕获语义。JLGE使用了6个信息图,分成两块:(1)user-user 和 POI-POI (2)user-location, user-time, location-user, and location-time.包括三个步骤:(1)构建信息图和带权边;(2)使用LINE模型从上面6个信息图中学习用户和poi嵌入到相同(3)最后调节获得每个用户的最终推荐POI。DYSTAL 两个模块,第一个是网络嵌入,和一个动态因子图模型。网络嵌入有三个图POI-POI, user-POI, and user-user,动态因子图是捕获不同的用户和POI之间的关系,来挖掘时空关系。

GAN

Geo-ALM中将时间序列的历史数据看作是判别器,去预测候选矩阵数据之间排序关系,并最大程度的提高候选矩阵排序的可能性。该生成器不断生成临界负样本,然后将负样本与正样本耦合,形成训练集。利用该框架可互换地学习两个不同模块之间的参数。APOIR包含GAN,GRU,和矩阵分解(MF)。GRU和MF组合学习用户的时间和空间关系。两个重要组件是:推荐器和鉴别器交替优化,通过目标函数使用用户学习的关系来训练两者。判别器目标是最大可能正确的,从推荐器生成的推荐的POI中判断出正确的check-in位置。Gao等[101]也使用GAN通过利用用户的轨迹来识别用户。

其他模型

TEMN TEMN包括三个关键部分:TEMN包括三个关键部分:记忆网络(MN)、时间潜在Dirichlet分配(TLDA)和地理建模。MN学习用户和poi之间的复杂交互,捕捉用户基于位置兴趣点。TLDA是一种无监督生成概率模型,它能够捕捉用户的时间偏好和内在兴趣。这个模块提供了模式-用户概率分布。通过TLDA还可以估计出与每个模式相关的场地和时段的分布。TLDA和MN可以共同学习用户和POIs的特征。地理模型抓住了地理的影响。


table 2


table 2


POI序列推荐

到目前为止,我们主要讨论了下一个POI推荐模型。然而,一些最先进的方法还推荐了一系列poi,这些poi在将来更有可能被用户访问。在POI序列建议中,输入是一个签入序列或签入列表,输出也是一个签入列表。因此,我们可以将此建议视为序列到序列(Seq2Seq)任务。近年来提出了几种最先进的方法来解决POI序列推荐任务。这里我们简要地讨论其中的一些。GLRGLR基于word2vec[124]技术学习潜在向量。本文在GLR模型中加入了用户偏好、时间连续过渡影响、地理影响和LSTM。

影响因素

在第5节中,我们强调了在POI推荐领域已经进行了广泛的研究。在所有这些著作中,研究人员试图找出对poi推荐任务最有影响的因素。

空间因素

POI推荐的顺序效应类似于自然语言处理问题的类比——比如造一个句子,下一个单词依赖于前一个单词。序列排序对POI推荐有重要影响。Zhang等人从所有用户的位置序列中提取序列模式,并将其建模为简洁的位置-位置转换图。然后根据转移计数和传出计数确定转移概率。最后,模型根据签到位置的到达顺序对其进行处理,并对构建的位置-位置过渡图进行增量更新。

地理因素

最近的研究表明,人们倾向于访问他/她附近的地方或接近的地方已经访问的人。在一个区域内签到某个地点的用户有相对较大的可能性访问距离较近的地方。用户倾向于去商店,市场,或访问附近的野餐地点,他们住。而且,在参观完某个旅游景点后,人们往往会去附近的餐馆或购物中心。因此,空间邻近性是一个值得关注的问题,以预测用户的下一个位置。为了了解地理上的用户偏好,该模型将空间影响和用户移动性编码到用户签到过程中。此外,该模型采用贝叶斯概率非负潜在因素模型来编码空间影响和个性化偏好。

语义因素

每个POI都有一些属性,如果两个POI由相似的属性组成,则它们在语义上相互接近。每个人都有自己的偏好,人们希望访问那些与自己偏好相匹配的POI。因此,我们可以从用户的check-in列表中捕获用户首选项,并尝试预测那些在语义上与以前的check-in非常相似的POI。

[131, 129, 75, 42, 102]是一些利用数据集的语义信息预测下一个POI的论文。Kefalas等人利用评论之间的文本影响,指的是评论之间的相似性(类似小红书评论)。Ye等人为POI网络使用语义标注技术自动标注所有带有类别标签的地方。标注算法对标签空间中的每个标签学习一个二值支持向量机分类器,以支持多标签分类。该算法提取具有相同标记的地方的特征,处理具有相同标记的地方的语义标注和地方之间的相关性。Wu等人学习了poi的短期和长期语境特征,并利用注意机制捕获用户偏好。Li等人提出了一种编码器-解码器神经网络模型,该模型利用嵌入方法来整合与每个签入活动相关的异构上下文因素,以填充签入的语义。本文将签到的用户和时间、数字因素和分类因素嵌入到上下文中。Chang等人利用提供关于POI特征信息的文本内容。他们还通过计算文本内容中poi的Jaccard相似性来衡量单词之间的相关性。文本内容层将文本内容视为一个句子,使用Word2Vec训练单词嵌入向量。所有这些工作都采用了不同的技术,只是为了从poi中捕获语义特征,以获得更好的推荐性能。

社会因素

人类是社会动物。所以,一个人的决定很大程度上取决于他/她的社会地位、朋友、邻居、文化等。这些社会影响影响了一个人访问POI的兴趣。当用户的朋友对POI给予好评时,用户访问该POI的概率就会增加。为了解决冷启动问题,新用户的社交圈可以非常有益,因此,模型可以通过建议用户社交圈的相同poi来了解用户的偏好。[51, 102, 129]利用社会影响来改善他们的POI预测。Christoforidis等人在[51]中将社会影响与空间和时间背景结合起来,并将图表组合成一个统一的预测模型。Kefalas等人[129]试图通过用户评论获取社会影响力。具有相似词汇表的用户被认为是相关的。在这里,社会影响对应的是目标用户和他人之间的相关关系,在词汇分析他们的评论。大量利用社会影响力的作品证明了社会效应在POI推荐中的重要性。

Temporal Influence

人类的生活由固定的时间模式组成。用户在一天中不同的时间显示不同的签到偏好,并且在连续的时间比在非连续的时间有相似的偏好。用户活动受时间的影响。用户会在中午去餐厅而不是酒吧,人们可能会在假期出现时去参观地方。

[133,132,90,51,77]在POI推荐系统中考虑了时间效应。Gao等人[132]引入了一种时间状态来表示一天中的小时数。然后,他们使用时间状态定义了依赖于时间的用户签到偏好。提出了一种利用时间系数最小化目标函数的时间正则化方法。他们提出的LRT框架包括时间划分、时间因子分解和时间聚合。Yuan等人[133]利用其他用户对poi的时间偏好进行协同过滤。为了捕获用户每日移动性的固定例行,该模型将时间分成小时时段,并通过该时段内用户访问的POIs来建模该时段内用户对POIs的时间偏好。当计算两个用户之间的相似性时,他们会利用时间因素,并考虑存储库中每次的历史签入。Doan等人[77]使用了一种用于利用时空信息的注意机制。

Shortcomings and Challenges

数据稀疏性

数据稀疏性是构建位置推荐系统最关键的问题之一,因为图和矩阵比其他推荐系统稀疏得多。从用户的角度来看,一个人在他/她的一生中旅行到的地方很少,相比之下,可以访问的poi数量绝对巨大。此外,探索不同poi的成本明显高于探索其他推荐领域的不同选择,这进一步加剧了数据稀疏性问题。因此,在数据集中描述的用户和poi之间的关系是真正稀疏的。因此,利用稀疏数据集设计有效的POI推荐系统一直是一个挑战。

冷启动当用户加入LBSN网络时,由于缺乏对该用户的恰当描述,导致初始推荐性能较差。类似地,当创建一个新的POI以供探索时,由于缺乏与该POI相关的历史轨迹,它在推荐方面严重滞后于已经存在的POI。由于目前大多数推荐模型都存在这个问题,消除冷启动问题是POI推荐中一个很有前途的研究方向。

基准数据集缺乏虽然Foursquare、Gowalla、Yelp和Weeplaces等流行的签到数据集在之前的作品中大量使用,但这些数据集的庞大规模让它们不可能一次性全部使用。因此,之前的大部分工作只选取这些数据集的一个子集(例如特定时间框架内城市的签到)来评估所提出的模型。此外,POI推荐的最新进展表明,除了签入之外,文本描述、用户评论等其他形式的数据可以提高推荐性能。然而,流行的数据集不包含这些数据,这导致了包含这些数据的新数据集(例如Instagram数据集)的提议。不同模型中使用的数据集的多样性使得比较不同的最新模型的性能非常困难。一个包含来自各种模式的数据的基准数据集可以解决这些问题,从而为评估不同模型的性能打下坚实的基础。

缺乏在线学习通过对不同模型的分析,我们发现文献中大多数POI推荐模型使用离线学习,即模型在部署前只能用可用数据进行一次训练。在现实世界中,这种策略并不是最优的,因为每天用户都会生成大量新的签到数据,这些数据包含关于用户偏好变化的关键信息。因此,一种可以在新数据可用时更新模型的在线学习策略非常重要,这样即使在不断变化的环境中,模型也可以随着时间的推移提供最佳推荐性能。

隐私保留POI建议和许多其他基于位置的服务一样,用户隐私是POI推荐系统扩散的主要瓶颈。在很多情况下,用户不愿意分享他们的GPS跟踪信息,因为从位置跟踪来看,对手可能会泄露用户的许多敏感和私人信息。因此,越来越需要设计一个隐私保护的POI推荐系统。几种非深度学习方法,Liu等人[134]和Chen等人[135]保护了用户数据的隐私。然而,由于这些方法也需要在一个中心位置聚集来自用户的数据,因此仍然存在很多隐私问题。我们设想POI推荐技术可以利用一个新的隐私保护学习领域,即联邦学习,它不需要在任何中心站点积累用户数据。

从本质上说,联邦学习是一种机器学习技术,它使用多个设备的本地数据样本训练算法,而不交换它们。在传统的分布式学习中,所有的数据都分布在多个集中的服务器上,不能保证用户数据的私密性和数据的安全性。但是在联邦学习中,用户不需要共享他们的数据。他们可以使用本地数据训练模型,并共享模型参数。因此,联邦学习确保了数据隐私性和数据稀疏性问题。在这种情况下,Wang等人[40]最近通过生成教师和学生模型提出了一个模型LLRec。虽然该思想与联邦学习的概念很接近,但它没有像联邦学习那样充分利用参数共享。因此,开发联邦友好学习模型是该领域一个有趣的研究方向。

社会团体推荐以前的工作主要关注个性化的POI推荐,其中用户的历史签入以及其他属性都被考虑在内。然而,针对一组用户的POI推荐在文献中大多不被关注。针对社会群体的推荐与个性化POI推荐有很大的不同,因为每个群体成员可能对选择POI有不同的偏好。为一组用户推荐POI时,社交方面变得尤为重要,目前大多数个性化POI推荐模型都无法正确处理这一点。Wang等[136]使用矩阵分解和聚类技术进行组POI推荐。但是这样一个简单的模型没有利用外部特性,这在很大程度上限制了模型的性能。因此,一个基于深度学习的社会群体POI推荐模型对团体旅游尤其有帮助。


table 2


Conclusion

在本文中,我们对基于深度学习的POI推荐系统进行了全面的研究。我们已经在这个新兴的研究领域提出了大量的最新研究论文的深刻发现。我们根据不同的深度学习范式对POI推荐模型进行了分类,并比较了它们的竞争(劣势)优势。我们还介绍了这些技术的性能结果,针对不同的实际数据集采用不同的性能指标。我们已经确定了影响POI建议的不同因素,并提供了每个因素的表格分析。最后,我们讨论了POI推荐的一系列未来工作,为这一领域的新研究者提供指导。据我们所知,这项工作是第一次全面回顾基于深度学习的POI建议。

编辑于 2021-07-26 14:14