首发于小魏的论文阅读笔记

虚假新闻检测（Fake News Detection with Heterogenous Deep Graph Convolutional Network）

残血的三井寿

有梦想的小魏同学

今天分享一篇来自PAKDD2021的一篇关于虚假新闻检测的文章《Fake News Detection with Heterogenous Deep Graph Convolutional Network》，论文作者来自中科院。

motivation：以往的研究往往基于新闻的内容对其进行虚假新闻检测，但是这是不够的。因此作者建立了新闻之间的互相关联，这其中包括新闻之间发布时间的关系，主题关系，内容关系，以及源头关系。作者建立一个异质网去建模新闻以及新闻之间的关系，并且，作者设计一种新的异质图神经网络HDGCN去得到新闻的嵌入表示，并且将其应用与新闻分类任务中。

模型输入：新闻文本，评论，新闻的发布源，新闻的领域，

模型输出：对虚假新闻的判断。

节点类型：新闻节点、领域节点、回复节点、源节点

边关系：相似的主题、相似的内容、相似的源头、时间、

节点初始化：首先使用Glove对节点的词信息进行初始化，

新闻节点和回复节点：使用双向LSTM得到新闻节点和回复节点的初始化内容；信息源的节点初始化是将所有的新闻节点以及回复节点的总和；对于领域节点，总和了该领域的100个高出现的词嵌入的总和。

边的初始化：

ND-relation：新闻节点和领域节点的关系。如果确定，则权值为1。

NR-relation：新闻-评论关系，当用户支持或者反对这个新闻，则该边的权重应该是比较大或者比较小的，当态度是中立的，则边的权值将十分小。计算公式如下：

NS-relation：新闻和出版商之间的关系，如果有关系的话，则权重为1。

NT-relation：如果两个新闻都是在相似的时间段内发表的，则认为两个新闻是有关系的。边的权值计算公式如下：

NN-relation：新闻和新闻之间的关系，如果两个新闻的寓意相似度超过阈值，则认为有关系，计算公式如下：

HDGCN：

Hierarchical Attention Strategy：

注意力分为两层，一个是各种节点之间的注意力，一种是各个层次之间的注意力。

第一个是融合所有节点的注意力：

第二个是融合所有层的注意力：

最终的判断：

实验：

数据集：

效果：

发布于 2021-09-27 17:02

自然语言处理

文章被以下专栏收录

小魏的论文阅读笔记

学生的论文阅读分享