PAKDD17 | Marked Temporal Dynamics Modeling based on RNN

2017 年 7 月 11 日 中国科学院网络数据重点实验室 Mr. King

PAKDD17 | Marked Temporal Dynamics Modeling based on Recurrent Neural Network

Author: Yongqing Wang, Shenhua Liu, Huawei Shen, Jinhua Gao and XueqiCheng



前言:2017523-26日在韩国济州岛召开了PAKDD17 The Pacific-Asia Conference on Knowledge Discovery and Data Ming, 2017)国际学术会议,会上实验室的博士研究生王永庆和刘雅辉分别对发表论文《Marked Temporal Dynamics Modeling based on Recurrent Neural Network》以及《Do rumors diffuse differently from non-rumors? A systematically empirical analysis in Sina Weibofor rumor identification》做了会议报告,本次介绍其中的一篇会议报告:Marked Temporal Dynamics Modeling based on Recurrent Neural Network

 

在介绍工作之前,先明确一些基本概念。首先说明的是时空序列,时空序列中的时和空分别是时间和空间,两者构成了对单一事件的基本描述。以购物场景为例,某一用户一次购物事件的基本描述为:何时在何地购买商品。用户在该场景中的时空序列表示其在一段观测窗口内的消费序列。建模时空序列,目标是建模时空序列的产生过程,用以推断下一事件的发生时间和空间。在传统工作中,考虑到时间和空间并不在同一尺度,因而解决时空建模问题常将其分为两部分单独解决:要么建模空间序列,要么建模时间序列。在建模空间序列的工作中,典型的例如马尔科夫过程,建模空间内从一个点跳转至下一个点的跳转概率;在建模时间序列的工作中,利用一系列的时序模型,建模各个跳转所需的时间消耗。那么,有没有一种可能,可以联合描述一个事件的时间和空间,进而建模完整的时空序列呢?问题的关键是,如何将时间和空间转换到同一尺度空间下。


我们借助于循环神经网络来实现这种转换,对于时空建模而言,输入:已观测的事件序列,输出:下一事件。输入和输出的形式都是事件,循环神经网络的作用是将输入进行编码,继而再做解码还原为事件描述输出。由于需要统一时间和空间,人为的方式难以定义这种编解码的过程,因此藉以能够通过循环神经网络去寻找。图1展示了一个利用循环神经网络对时空建模的基本框架:左侧为编码过程,右侧为解码过程。图中的te分别表示时间和空间变量,在编码前,我们预先对时间和空间进行Φ(t)φ (e)转换,使之能够作为神经网络的输入;编码过程的输出,我们称为表达h,作为解码过程的输入,通过函数sr做解码变换确定下一可能发生的事件。可以发现,表达h是连接编解码过程的关键,是统一时间和空间的一结果。


1 Recurrent marked temporal point processes RMTPP


利用图1所提的框架解决了时空建模过程中时空异质问题,其在部分应用问题上也得到了证实。但我们发现上述解码过程存在一个问题,时间和空间变量是单独解码的,这种独立解码的方式会在解码过程中损失一定的精度,导致对事件的描述不够准确。还是以购物为例,假设有两个人分别在北京西单大悦城购物,其中一个人逛完上场完之后坐上地铁去了簋街小吃街,而另外一人则去了位于西单的首都电影院打算去看一场电影。根据地图显示,从大悦城去簋街需要35分钟左右的时间,而去首都电影院只需要坐上电梯,花上大约3-5分钟的时间就可以。可以看到,时间消耗和目的地有明确的关系,而独立解码则会忽略两者之间的关联性。在真实数据中,这种情况又常见么?接下来我们对大众点评中团购频道的数据进行了统计,用以说明我们不能忽视这种时空存在关联的现象。图2是数据的统计结果,我们选择了某一特定店铺,在线团购中,用户在该店铺进行消费后,我们观测他们的下一消费选择会如何变化。图中枚举了5家用户后续经常选择的店铺,可以看到,不同的选择所消耗的时间会存在明显差异。假如,我们采用之前独立解码的方式,那么最后拟合出来的结果会如图2中实线部分所示,这显然不是我们想要的结果。


2大众点评团购数据统计结果。图上标识了在线团购中用户在某一特定店铺消费后下一笔团购的不同选择


要解决这一问题,也并非难事,我们只需要在图1的框架中添加一条连接关系即可。我们提出一种存在先后次序的针对时间和空间的解码方式:先确定空间变量,而后由空间变量以及时空的联合表达h确定时间变量。当然,这种先空间后时间的解码顺序也可以进行置换,这里我们只讨论图2中的情况。增加了图2中的这条连接关系后,我们就能区分用户从大悦城出发去簋街和去首都电影院这两个不同地点所需要消耗的时间,也能更为准确的刻画解码过程。


3 Marked temporal dynamics modeling based on RNN (RNN-TD)


我们在两个实验数据集上比较前后两种框架的差异性:一组为用户博客数据(Memetracker),一组为大众点评的团购消费数据(Dianping)。我们分别采用两种框架用来预测下一事件的发生时间,并将其精度展示于图4中。可以看到,考虑解码过程中时间和空间关联关系的后一种框架(RNN-TD),其在预测精度上优于不考虑这种关联关系进行解码的框架(RMTPP)。也就是说,这条增加的连接关系是确实有效的。


4 RMTPPRNN-TD在两组实验数据集上对时间预测的比较结果

 

会议酒店KALHotel

 

报告现场:


 

济州岛风景:


欢迎关注作者微信公众号



登录查看更多
1

相关内容

亚太知识发现和数据挖掘会议(PAKDD)是数据挖掘和知识发现领域成立时间最长、最具领导地位的国际会议之一。它为研究人员和行业从业者提供了一个国际论坛,以分享他们来自所有KDD相关领域的新思想、原始研究成果和实际开发经验,包括数据挖掘、数据仓库、机器学习、人工智能、数据库、统计、知识工程、可视化、决策系统和新兴应用程序。 官网地址:http://dblp.uni-trier.de/db/conf/pakdd/
【紫冬声音】基于人体骨架的行为识别
中国自动化学会
16+阅读 · 2019年1月30日
【紫冬分享】基于人体骨架的行为识别
中国科学院自动化研究所
20+阅读 · 2019年1月18日
三次简化一张图:一招理解LSTM/GRU门控机制
机器之心
15+阅读 · 2018年12月18日
一文读懂LSTM和循环神经网络
七月在线实验室
8+阅读 · 2018年4月18日
干货|基于双流递归神经网络的人体骨架行为识别!
全球人工智能
13+阅读 · 2017年12月15日
完全图解RNN、RNN变体、Seq2Seq、Attention机制
AI研习社
12+阅读 · 2017年9月5日
【技术分享】基于双流递归神经网络的人体骨架行为识别
机器学习研究会
5+阅读 · 2017年9月1日
IJCAI | Cascade Dynamics Modeling with Attention-based RNN
KingsGarden
13+阅读 · 2017年7月16日
RNN | RNN实践指南(1)
KingsGarden
21+阅读 · 2017年4月4日
Arxiv
29+阅读 · 2020年3月16日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
3+阅读 · 2018年5月11日
Arxiv
6+阅读 · 2018年2月24日
VIP会员
相关VIP内容
相关资讯
【紫冬声音】基于人体骨架的行为识别
中国自动化学会
16+阅读 · 2019年1月30日
【紫冬分享】基于人体骨架的行为识别
中国科学院自动化研究所
20+阅读 · 2019年1月18日
三次简化一张图:一招理解LSTM/GRU门控机制
机器之心
15+阅读 · 2018年12月18日
一文读懂LSTM和循环神经网络
七月在线实验室
8+阅读 · 2018年4月18日
干货|基于双流递归神经网络的人体骨架行为识别!
全球人工智能
13+阅读 · 2017年12月15日
完全图解RNN、RNN变体、Seq2Seq、Attention机制
AI研习社
12+阅读 · 2017年9月5日
【技术分享】基于双流递归神经网络的人体骨架行为识别
机器学习研究会
5+阅读 · 2017年9月1日
IJCAI | Cascade Dynamics Modeling with Attention-based RNN
KingsGarden
13+阅读 · 2017年7月16日
RNN | RNN实践指南(1)
KingsGarden
21+阅读 · 2017年4月4日
Top
微信扫码咨询专知VIP会员