现实生活中大量的真实图数据都带有时间信息。这些时间信息对于图上的预测任务往往至关重要。比如在电商场景下,用户购买商品的行为具有很强的季节性。又比如在风控场景中,很多攻击模式不仅仅在图结构,也在时间上有很强的特征。
因此,本次WSDM Cup 2021首次推出了大规模时序图预测挑战。和普通的链接预测相比,时序图预测要求模型判断在给定的时间段内,两点之间是否形成连边。
链接:https://www.dgl.ai/WSDM2022-Challenge/
本次比赛给了2个动态图数据集A和B,一个是时间图,一个是用户-商品交互图,其边都带有时间信息。
1. 数据集A为交互事件图 (event graph)。点代表实体对象(entity),边代表对象间发生的事件(event)。该数据集共收集了19K个实体对象以及27M个对象间的交互事件。
2. 数据集B为用户-商品二部图 (user-item graph)。分别有两类节点(用户和商品)。边则代表用户和商品的交互关系。该数据集包含1.2M个节点以及8.3M条边。