场景图以结构化、符号化的方式将图像的高层内容进行了概括,两幅图像的场景图之间的相似性反映了其内容的相关性。基于这一思想,我们提出了一种利用图神经网络测量场景图相似度的图像到图像检索新方法。在我们的方法中,图神经网络被训练来预测代理图像的关联度量,使用预先训练的句子相似度模型从人工标注的标题计算。我们收集并发布由人类标注员测量的图像相关性数据集,以评估检索算法。收集到的数据集表明,我们的方法比其他基准方法更符合人类对图像相似性的感知。
https://www.zhuanzhi.ai/paper/36010276b120c7ce7d78a8b4b2427f71