虚假新闻检测(Fake News Detection with Heterogenous Deep Graph Convolutional Network)

今天分享一篇来自PAKDD2021的一篇关于虚假新闻检测的文章《Fake News Detection with Heterogenous Deep Graph Convolutional Network》,论文作者来自中科院。

motivation:以往的研究往往基于新闻的内容对其进行虚假新闻检测,但是这是不够的。因此作者建立了新闻之间的互相关联,这其中包括新闻之间发布时间的关系,主题关系,内容关系,以及源头关系。作者建立一个异质网去建模新闻以及新闻之间的关系,并且,作者设计一种新的异质图神经网络HDGCN去得到新闻的嵌入表示,并且将其应用与新闻分类任务中。

模型输入:新闻文本,评论,新闻的发布源,新闻的领域,

模型输出:对虚假新闻的判断。

节点类型:新闻节点、领域节点、回复节点、源节点

边关系:相似的主题、相似的内容、相似的源头、时间、

节点初始化:首先使用Glove对节点的词信息进行初始化,

新闻节点和回复节点:使用双向LSTM得到新闻节点和回复节点的初始化内容;信息源的节点初始化是将所有的新闻节点以及回复节点的总和;对于领域节点,总和了该领域的100个高出现的词嵌入的总和。

边的初始化:

ND-relation:新闻节点和领域节点的关系。如果确定,则权值为1。

NR-relation:新闻-评论关系,当用户支持或者反对这个新闻,则该边的权重应该是比较大或者比较小的,当态度是中立的,则边的权值将十分小。计算公式如下:

NS-relation:新闻和出版商之间的关系,如果有关系的话,则权重为1。

NT-relation:如果两个新闻都是在相似的时间段内发表的,则认为两个新闻是有关系的。边的权值计算公式如下:

NN-relation:新闻和新闻之间的关系,如果两个新闻的寓意相似度超过阈值,则认为有关系,计算公式如下:

HDGCN:

Hierarchical Attention Strategy:

注意力分为两层,一个是各种节点之间的注意力,一种是各个层次之间的注意力。

第一个是融合所有节点的注意力:

第二个是融合所有层的注意力:

最终的判断:

实验:

数据集:

效果:

发布于 2021-09-27 17:02