Background. After a year and half and over 4 million deaths, the COVID-19 pandemic continues to be widespread, and its related topics continue to dominate the global media. Although COVID-19 diagnoses have been well monitored, neither the impacts of the disease on human behavior and social dynamics nor the effectiveness of policy interventions aimed at its containment are fully understood. Monitoring the spatial and temporal patterns of behavior, social dynamics and policy - and then their interrelations - can provide critical information for preparatory action and effective response. Methods. Here we present an open-source dataset of 1.92 million keyword-selected Twitter posts, updated weekly from January 2020 to present, along with a dynamic dashboard showing totals at national and subnational administrative divisions. Results. The dashboard presents 100% of the geotagged tweets that contain keywords or hashtags related COVID-19. We validated our inclusion criteria using a machine learning-based text classifier and found that 88% of the selected tweets were correctly labeled as related to COVID-19. With this information we tested the correlation between tweets and covid diagnosis from January 1, 2020 through December 31, 2020 and see a decreasing correlation across time. Conclusions. With emerging COVID variants but ongoing vaccine hesitancy and resistance, this dataset could be used by researchers to study numerous aspects of COVID-19 and provide valuable insights for preparing future pandemics.


翻译:在经历了一年半和四百多万人的死亡之后,COVID-19大流行病仍然广泛存在,其相关专题继续在全球媒体中占主导地位。虽然COVID-19的诊断得到了很好的监测,但该疾病对人类行为和社会动态的影响以及旨在遏制该流行病的政策干预措施的有效性都没有得到充分的了解。监测行为的空间和时间模式、社会动态和政策,以及随后的相互关系,可以为准备行动和有效应对提供关键信息。方法。我们在这里提供了一套公开源数据集,从2020年1月到现在每周更新的192万个关键词选择的Twitter文章,以及一个动态仪表板,显示国家和国家以下行政司的总数。结果:该仪表板展示了100%的Geooted twitter,其中含有与COVID-19相关的关键词或标签。我们用一个基于机器的文本解析器验证了我们的包容性标准,发现88%的选定推特被正确标为与COVID-19有关。我们测试了2020年1月1日至2020年12月31日的推文与COVI诊断的相关性,但从2020年12月31日至2010年D年12月31日期间,我们测试了这些信息,并看到一个动态仪表仪表显示了国家和国行政司之间的相关性。结果。结果显示,100%地标标标点显示了100%的贴关系。我们使用了CVI正在不断更新的数据和不断更新的数据。通过使用中的数据。

0
下载
关闭预览

相关内容

COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
43+阅读 · 2020年7月2日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
155+阅读 · 2019年10月12日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
104+阅读 · 2019年10月9日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
计算机 | IUI 2020等国际会议信息4条
Call4Papers
6+阅读 · 2019年6月17日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
美国化学会 (ACS) 北京代表处招聘
知社学术圈
11+阅读 · 2018年9月4日
人工智能 | AAAI 2019等国际会议信息7条
Call4Papers
5+阅读 · 2018年9月3日
[DLdigest-8] 每日一道算法
深度学习每日摘要
4+阅读 · 2017年11月2日
【计算机类】期刊专刊/国际会议截稿信息6条
Call4Papers
3+阅读 · 2017年10月13日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【推荐】用Tensorflow理解LSTM
机器学习研究会
36+阅读 · 2017年9月11日
Arxiv
0+阅读 · 2021年10月13日
Privacy-Preserving News Recommendation Model Learning
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关资讯
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
计算机 | IUI 2020等国际会议信息4条
Call4Papers
6+阅读 · 2019年6月17日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
美国化学会 (ACS) 北京代表处招聘
知社学术圈
11+阅读 · 2018年9月4日
人工智能 | AAAI 2019等国际会议信息7条
Call4Papers
5+阅读 · 2018年9月3日
[DLdigest-8] 每日一道算法
深度学习每日摘要
4+阅读 · 2017年11月2日
【计算机类】期刊专刊/国际会议截稿信息6条
Call4Papers
3+阅读 · 2017年10月13日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【推荐】用Tensorflow理解LSTM
机器学习研究会
36+阅读 · 2017年9月11日
Top
微信扫码咨询专知VIP会员