OGB是目前公认的图学习基准数据集代表,由斯坦福大学Jure Leskovec教授团队建立,于2019年国际顶级学术会议NeurIPS上正式开源。为促进大规模图数据上算法的研究发展,第一届大规模图数据挑战赛OGB-LSC[1]于2021年KDD CUP举行,其囊括了节点性质预测、边性质链接预测、图性质预测等图学习领域众多权威赛道,以质量高、规模大、场景复杂、难度高著称,素有图学习领域“ImageNet”之称,吸引了包括微软、Deepmind、Facebook、阿里巴巴、百度、字节跳动、斯坦福、MIT、北京大学等众多顶尖高校和科技公司参与。
注:以下内容选自OGB-LSC NeurIPS 2022比赛项目主页
大规模图数据(如具有数十亿条边的图)的机器学习研究具有巨大的影响力。在2021年的KDD杯上,我们组织了第一届OGB大规模图数据挑战赛(OGB-LSC),我们提供了大型和真实的图机器学习任务。KDD杯吸引了图机器学习社区的巨大关注(全球有500多个团队注册,约150个团队参加),促进了创新方法的开发,产生了重大的性能突破。然而,大图上的机器学习问题仍然还没有得到解决,目前亟需社区在这一领域进行集中努力(类似ImageNet和MS-COCO)。
对于NeurIPS 2022竞赛轨道,我们围绕OGB-LSC数据集组织了第二届OGB-LSC(简称OGB-LSC 2022),这次比赛将再次推动新方法的发展,并允许跟踪最新技术进展。重要的是,我们根据KDD杯的经验教训,更新了三个数据集中的两个(WikiKG90Mv2和PCQM4Mv2),因此产生的数据集更具挑战性和现实性。
我们提供了三个OGB-LSC数据集,其规模空前庞大,分别涵盖了节点、链接和图层面的预测。下面是对这三个OGB-LSC数据集的说明性概述。
本次比赛提供两种测试集:test-dev和test-challenge。对于这次NeurIPS挑战赛,请使用test-challenge。test-dev用于公共排行榜,社区可以在这一年中评估他们的模型性能。我们鼓励在NeurIPS比赛期间提交test-dev,但为了有资格进入排行榜,我们需要公开代码和技术报告。更多的细节可以在这里[2]找到。
https://ogb.stanford.edu/neurips2022/
第一届大规模图数据挑战赛OGB-LSC: https://ogb.stanford.edu/docs/lsc/
[2]OGB-LSC排行榜: https://ogb.stanford.edu/docs/lsc/leaderboards