主题: Graph Neural Networks with Continual Learning for Fake News Detection from Social Media
摘要: 尽管已经花费大量精力进行事实核查,但假新闻在社交媒体上的普遍使用对司法,公众信任以及我们整个社会都产生了深远影响,仍然是一个严重的问题。在这项工作中,我们专注于基于传播的虚假新闻检测,因为最近的研究表明,虚假新闻和真实新闻在网络上的传播方式不同。具体来说,考虑到图神经网络(GNN)处理非欧氏数据的能力,我们使用GNN区分社交媒体上的假新闻和真实新闻的传播方式。具体来说,我们集中在两个问题上:(1)在不依赖任何文本信息(例如推文内容,回复和用户描述)的情况下,GNN如何准确地识别假新闻?众所周知,机器学习模型容易受到对抗性攻击,而避免依赖于基于文本的功能会使模型不易受到高级假新闻造假者的操纵。 (2)如何处理看不见的新数据?换句话说,在给定的数据集上训练的GNN如何在新的且可能完全不同的数据集上执行?如果性能不能令人满意,我们如何解决该问题而又不从头开始对整个数据重新训练模型,而随着数据量的增长,这在实践中将变得过高地昂贵?我们在具有数千个带有标签新闻的两个数据集上研究了上述问题,我们的结果表明:(1)GNN确实可以实现可比或更高的性能,而无需任何文本信息即可达到最新方法。 (2)在给定的数据集上训练的GNN在新的,看不见的数据上可能表现不佳,并且直接增量训练无法解决问题-在以前的将GNN用于伪造新闻检测的工作中,尚未解决此问题。为了解决该问题,我们提出了一种方法,该方法通过使用持续学习中的技术逐步训练GNN,从而在现有数据集和新数据集上均达到平衡的性能。