In this paper we introduce ArCOV19-Rumors, an Arabic COVID-19 Twitter dataset for misinformation detection composed of tweets containing claims from 27th January till the end of April 2020. We collected 138 verified claims, mostly from popular fact-checking websites, and identified 9.4K relevant tweets to those claims. Tweets were manually-annotated by veracity to support research on misinformation detection, which is one of the major problems faced during a pandemic. ArCOV19-Rumors supports two levels of misinformation detection over Twitter: verifying free-text claims (called claim-level verification) and verifying claims expressed in tweets (called tweet-level verification). Our dataset covers, in addition to health, claims related to other topical categories that were influenced by COVID-19, namely, social, politics, sports, entertainment, and religious. Moreover, we present benchmarking results for tweet-level verification on the dataset. We experimented with SOTA models of versatile approaches that either exploit content, user profiles features, temporal features and propagation structure of the conversational threads for tweet verification.


翻译:在本文中,我们介绍了ArCOV19-Rumors(ARCOV19-Rumors),这是阿拉伯文的COVID-19 Twitter数据集,用于检测错误信息,该数据集由载有2020年1月27日至4月底期间索赔要求的推文构成;我们收集了138项经核实的索赔要求,大多来自公众的实况调查网站,并查明了与这些索赔要求相关的9.4K推特;Tweets用人工附加真实性说明,以支持对错误信息检测的研究,这是大流行病期间面临的主要问题之一;ArCOV19-Rumors支持在Twitter上进行两个层次的错误检测:核实自由文本索赔要求(所谓的索赔级别核查)和核实在推文中表达的主张(所谓的推特级别核查);除了健康外,我们的数据集涵盖与受COVID-19影响的其他主题类别(即社会、政治、体育、娱乐和宗教)相关的主张;此外,我们介绍了在推特上核实数据集的基准结果。我们尝试了SOTA方法的多种方法模式,这些模式既利用了内容、用户简介特征、时间特征,又利用谈话线索的传播结构核查。

0
下载
关闭预览

相关内容

【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
104+阅读 · 2020年3月22日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
超全的人脸识别数据集汇总,附打包下载
极市平台
90+阅读 · 2020年3月7日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
LibRec 精选:推荐系统的论文与源码
LibRec智能推荐
14+阅读 · 2018年11月29日
LibRec 精选:推荐系统9个必备数据集
LibRec智能推荐
6+阅读 · 2018年3月7日
【推荐】(TensorFlow)SSD实时手部检测与追踪(附代码)
机器学习研究会
11+阅读 · 2017年12月5日
【数据集】新的YELP数据集官方下载
机器学习研究会
16+阅读 · 2017年8月31日
One-Class Classification: A Survey
Arxiv
7+阅读 · 2021年1月8日
Arxiv
13+阅读 · 2020年10月19日
Arxiv
24+阅读 · 2020年3月11日
Deep Learning for Deepfakes Creation and Detection
Arxiv
6+阅读 · 2019年9月25日
Arxiv
7+阅读 · 2018年3月19日
VIP会员
相关VIP内容
【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
104+阅读 · 2020年3月22日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Top
微信扫码咨询专知VIP会员