近年来,图神经网络在文献分类中得到了广泛的应用。然而,现有的方法大多是基于没有句子级信息的静态词同现图,这带来了三个挑战:(1)词的歧义性(2)词的同义性(3)动态上下文依存。为了解决这些问题,我们提出了一种新的基于GNN的稀疏结构学习模型用于文档分类。具体地说,文档级图最初是由句子级词同现图的断开并集生成的。模型收集了一组可训练的连接句子间不相连词的边,利用结构学习对动态上下文依赖的边进行稀疏选取。具有稀疏结构的图可以通过GNN联合利用文档中的局部和全局上下文信息。在归纳学习中,将改进后的文档图进一步输入到一个通用的读出函数中,以端到端方式进行图级分类和优化。在几个真实世界数据集上的大量实验表明,提出的模型优于最先进的结果,并揭示了学习每个文档稀疏结构的必要性。
https://www.zhuanzhi.ai/paper/63b66dc21199c294e92d3703a5444d25