【导读】“当真相在穿鞋的时候,谎言已经跑遍了全城。”这句人们耳熟能详的名言说明了虚假新闻病毒般的传播性同时也可能带来巨大的社会危害。识别虚假新闻可以说是 Facebook 等社交网络目前最重视的问题,本文介绍了在自然语言处理领域的三种主要方法(基于内容,基于上下文,内容与上下文结合),来识别存在故意误导的新闻文章。
题目:False News On Social Media: A Data-Driven Survey
作者:Francesco Pierri, Stefano Ceri
【摘要】在过去的几年里,研究学者对在社交网络上传播假新闻的问题越来越感兴趣。这种对现实世界的威胁的大量反弹,推动了人们对检测和定性虚假新闻的广泛关注。事实上,社交媒体平台比传统的新闻媒体表现出了独特的特点,尤其有利于虚假信息的扩散。它们也对有关这一主题的各种可能的干预提出了独特的挑战。
随着这一问题引起全球的关注,它也越来越受到学术界的关注。论文目的是全面研究社交媒体上传播的虚假新闻的检测、特点和减轻等方面的最新进展,以及该领域未来研究面临的挑战和有待解决的问题。我们使用一种数据驱动的方法,侧重于对每个研究中用于描述错误信息的特征进行分类,以及对用于指导分类方法的数据集进行分类。在调查的最后,我们强调了新兴的方法,并且这些方法看起来最有希望解决假新闻这类的问题。
参考链接:
https://arxiv.org/abs/1902.07539
请关注专知公众号(点击上方蓝色专知关注)
后台回复“虚假新闻检测综述” 就可以获取最新论文的下载链接~
引言
本节为社交媒体虚假新闻话题的引言;提供一些术语,描述虚假新闻最普遍的社交媒体平台,概述其中涉及的心理和社会因素,讨论一些对现实世界的影响和一些公开的挑战。最后,我们将与现有的调研进行比较,讨论我们研究的重点。
近年来,“false news”和“fake news”这两个词被广泛地、可互换地用来指代各种各样的信息: 虚假信息(disinformation)、错误信息(misinformation)、恶作剧(hoaxes)、宣传(propaganda)、讽刺(satire)、谣言(rumors)、点击诱饵(clickbait)和垃圾新闻(junk news)。我们接下来提供文献中遇到的定义列表,这些定义并非详尽无遗。尽管人们普遍认为这些术语表明存在欺骗性信息,但我们认为仍然缺少一致同意且准确的定义。
一些研究者将false news定义为可能或故意误导读者的新闻文章,因为它们是可验证的,是故意为假的[3,56]。它们可以在形式上模仿传统新闻内容,但在意图或组织流程[27]中表示伪造的信息。对于更为传统的false news,fake news这一新词通常带有政治含义[27,68]。
本文详细介绍了最近针对fake news研究使用的三类方法基于内容,基于上下文,内容与上下文结合,具体可以查看原文。
在结尾,作者还认为:
鉴于最近在虚假新闻传播网络方面的工作,应该从网络分析中获得更多关于虚假新闻检测的见解;
未来的研究应克服人工事实核查的局限性,在无监督的情况下解决问题;
总体而言,研究界应该以一种更加结构化的方式,协调来自不同领域(从心理学到新闻学再到计算机科学)的努力;
未来的工作应该有利于开发真实世界的应用程序,为打击虚假新闻提供有效的帮助。
附教程内容
END-
专 · 知
专知《深度学习:算法到实战》课程全部完成!480+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询!
请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询《深度学习:算法到实战》课程,咨询技术商务合作~
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程