Along with COVID-19 pandemic we are also fighting an `infodemic'. Fake news and rumors are rampant on social media. Believing in rumors can cause significant harm. This is further exacerbated at the time of a pandemic. To tackle this, we curate and release a manually annotated dataset of 10,700 social media posts and articles of real and fake news on COVID-19. We benchmark the annotated dataset with four machine learning baselines - Decision Tree, Logistic Regression, Gradient Boost, and Support Vector Machine (SVM). We obtain the best performance of 93.46% F1-score with SVM. The data and code is available at: https://github.com/parthpatwa/covid19-fake-news-dectection


翻译:除了COVID-19大流行外,我们还在与“信息19大流行”作斗争。在社交媒体上,假消息和谣言十分猖獗。相信谣言会造成重大伤害。在大流行病发生时,情况会进一步恶化。为了解决这个问题,我们编辑和发行一个人工附加说明的数据集,其中包括10 700个社交媒体文章和在COVID-19上真实和假新闻的文章。我们用四个机器学习基线——决策树、后勤倒退、渐进靴子和辅助病媒机器(SVM)作为附加说明的数据集的基准。我们得到了SVM93.46%的F1-Score最佳性能。数据和代码见:https://github.com/parthpatwa/covid19-fake-news-dection。

0
下载
关闭预览

相关内容

专知会员服务
27+阅读 · 2021年1月29日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
47+阅读 · 2021年1月20日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
专知会员服务
27+阅读 · 2020年3月6日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
MIT-深度学习Deep Learning State of the Art in 2020,87页ppt
专知会员服务
61+阅读 · 2020年2月17日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
118+阅读 · 2019年6月16日
独家 | 基于NLP的COVID-19虚假新闻检测(附代码)
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
数据科学与机器学习数据集
Datartisan数据工匠
8+阅读 · 2017年12月14日
【推荐】Kaggle机器学习数据集推荐
机器学习研究会
8+阅读 · 2017年11月19日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
【推荐】SVM实例教程
机器学习研究会
17+阅读 · 2017年8月26日
Arxiv
0+阅读 · 2021年7月16日
Arxiv
13+阅读 · 2020年10月19日
VIP会员
相关VIP内容
专知会员服务
27+阅读 · 2021年1月29日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
47+阅读 · 2021年1月20日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
专知会员服务
27+阅读 · 2020年3月6日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
MIT-深度学习Deep Learning State of the Art in 2020,87页ppt
专知会员服务
61+阅读 · 2020年2月17日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
118+阅读 · 2019年6月16日
Top
微信扫码咨询专知VIP会员