The rapid increase in fake news, which causes significant damage to society, triggers many fake news related studies, including the development of fake news detection and fact verification techniques. The resources for these studies are mainly available as public datasets taken from Web data. We surveyed 118 datasets related to fake news research on a large scale from three perspectives: (1) fake news detection, (2) fact verification, and (3) other tasks; for example, the analysis of fake news and satire detection. We also describe in detail their utilization tasks and their characteristics. Finally, we highlight the challenges in the fake news dataset construction and some research opportunities that address these challenges. Our survey facilitates fake news research by helping researchers find suitable datasets without reinventing the wheel, and thereby, improves fake news studies in depth.


翻译:虚假新闻的迅速增加给社会造成重大损害,触发了许多虚假新闻相关研究,包括开发假新闻探测和事实核查技术,这些研究的资源主要作为从网络数据中提取的公共数据集提供,我们从三个角度调查了118个与大规模假新闻研究有关的数据集:(1) 假新闻探测,(2) 事实核查,(3) 其他任务;例如,分析假新闻和讽刺色探测。我们还详细描述其利用任务和特点。最后,我们强调假新闻数据集建设的挑战以及应对这些挑战的一些研究机会。我们的调查有助于假新闻研究,帮助研究人员找到合适的数据集,而不必重新造车,从而在深度上改进假新闻研究。

0
下载
关闭预览

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
人工智能 | ISAIR 2019诚邀稿件(推荐SCI期刊)
Call4Papers
6+阅读 · 2019年4月1日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
时序数据异常检测工具/数据集大列表
极市平台
65+阅读 · 2019年2月23日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
推荐|Andrew Ng计算机视觉教程总结
全球人工智能
3+阅读 · 2017年11月23日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Arxiv
0+阅读 · 2022年1月4日
Arxiv
7+阅读 · 2021年8月25日
Arxiv
16+阅读 · 2021年3月2日
Arxiv
13+阅读 · 2020年10月19日
Anomalous Instance Detection in Deep Learning: A Survey
Credibility-based Fake News Detection
Arxiv
3+阅读 · 2019年11月2日
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
VIP会员
相关VIP内容
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
人工智能 | ISAIR 2019诚邀稿件(推荐SCI期刊)
Call4Papers
6+阅读 · 2019年4月1日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
时序数据异常检测工具/数据集大列表
极市平台
65+阅读 · 2019年2月23日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
推荐|Andrew Ng计算机视觉教程总结
全球人工智能
3+阅读 · 2017年11月23日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
相关论文
Arxiv
0+阅读 · 2022年1月4日
Arxiv
7+阅读 · 2021年8月25日
Arxiv
16+阅读 · 2021年3月2日
Arxiv
13+阅读 · 2020年10月19日
Anomalous Instance Detection in Deep Learning: A Survey
Credibility-based Fake News Detection
Arxiv
3+阅读 · 2019年11月2日
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
Top
微信扫码咨询专知VIP会员