有史以来最直观!全球上百个新冠数据集各显神通,让你我都成为“半个流行病学家”

2020 年 4 月 27 日 学术头条

随着 COVID-19 数据集的日益普及,全球技术开发人员为流行病学家和数据科学专家们创建了一堆分析工具,来迅速汇总和分析 COVID-19 大流行的数据,让这次新型冠状病毒爆发成为有史以来最直观的一次。

通过这些宏观、全面、又详细的可视化数据集,我们每一个“吃瓜网民”都可以算得上半个流行病学家。

第一个数据分析仪表板和汇合工具出现在 COVID-19 爆发后不久。该仪表板由约翰·霍普金斯大学提供,成为了目前重要的数据源,它将来自世卫组织、疾病预防控制中心、ECDC、NHC、DXY、1point3acres、Worldometers.info、BNO、国家政府卫生部门以及当地媒体报道的数据进行汇合,形成可视化数据展示。


约翰·霍普金斯大学的 COVID-19 全球仪表板


约翰斯·霍普金斯大学也将数据放在了 GitHub 上。自 1 月 23 日发布该仪表板以来,COVID-19 已经成为公认的最可视化的大流行数据集。
GitHub 地址:https://github.com/CSSEGISandData/COVID-19


可视化分析大流行

除了约翰·霍普金斯大学的 COVID-19 全球仪表板,目前全球还有许多优秀的可视化分析数据集,比如:

  • 利用约翰霍普金斯大学 GitHub 存储库的数据,Tableau 公司发布了一个入门仪表盘,使其在 Tableau  Public 上可用,提供各种可视化模板,也设置了数据集的 .hyper , .tde 和 CSV 版本,便于访问。
    地址: https://www.tableau.com/covid-19-coronavirus-data-resources

  • 美国环境系统研究所公司(Esri)通过地图和地理定位技术应用于 COVID-19 的跟踪,此外还对 COVID-19 病例数据进行了本地化,并与来自权威医疗机构的病床可用性数据相结合。
    地址:https://www.esri.com/en-us/covid-19/overview

  • Facebook 和卡内基梅隆大学( Carnegie Mellon )将用户数据匿名化,以追踪全美范围内的 COVID-19 状况。
    地址:https://covid-survey.dataforgood.fb.com/

  • 《大西洋月刊》( Atlantic )的作者们正在使用开源软件收集来自多个来源的数据。
    地址:https://covidtracking.com/

  • GitHub 有一系列关于新型冠状病毒的数据集,而像 data.world 和 Kaggle这种竞赛、预测和可视化的平台也有新型冠状病毒的数据集。
    地址:https://data.world/

  • Reddit 有个专题专门展示一群爱好者和数据科学家的可视化成果,Our World in Data也对 COVID-19 的研究和数据进行了概述。
    地址:https://www.reddit.com/r/dataisbeautiful/

  • 数据服务公司 Starschema 已经列出了一个免费的数据集,旨在成为 COVID-19 病例发病率和死亡率的唯一真实数据来源,这些数据可以用人口密度和地理位置来扩充。
    地址:https://www.snowflake.com/datasets/starschema/

  • IBM 汇总了 COVID-19 数据,并将其与 Weather Channel  应用程序进行集成,该应用程序将天气数据和本地新型冠状病毒事件融合在一起。通过其天气频道应用,IBM 的子公司可以将相关的 COVID-19 数据提供给 3 亿的活跃用户。在谷歌和微软必应( Microsoft Bing )的共同努力下,IBM可视化技术将得以发展,把 COVID-19 数据带给大众。
    地址: https://accelerator.weather.com/bi

  • ESO是一家数据软件公司,专注于研究EMS、火灾和医院的急救人员的情况,以追踪全美各地的急救数据,该数据集收集了从院前到医院的反应,收集自全美 2600 家 EMS 机构,但不包括加州。
    地址:https://www.eso.com/covid-19/

  • 健康指标与评估研究所( Institute for Health Metrics and Evaluation )也有一组数据,关注医院病床的使用情况,以及重症监护床和呼吸机的需求。
    地址:https://covid19.healthdata.org/united-states-of-america

  • C3.ai 创建了一个统一的数据集,公开所有可用的 COVID-19 数据集。
    地址:https://c3.ai/products/c3-ai-covid-19-data-lake/



汇总到 C3 数据集中的数据集:

  • 约翰霍普金斯大学: COVID-19 数据仓库
    https://github.com/CSSEGISandData/COVID-19


  • 大西洋: COVID 跟踪项目
    https://covidtracking.com/


  • 纽约时报: COVID-19 在美国的数据
    https://github.com/nytimes/covid-19-data


  • nCoV-2019 数据工作组:流行病学数据
    https://github.com/beoutbreakprepared/nCoV2019/tree/master/latest_data


  • MOBS Lab: COVID-19 情况报告
    https://www.mobs-lab.org/2019ncov.html


  • 世界卫生组织:每日情况报告
    https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports


  • 欧洲疾病预防和控制中心:全球最新情况
    https://www.ecdc.europa.eu/en/covid-19-pandemic


  • 蒙特利尔大学: COVID-19 图像数据收集
    https://github.com/ieee8023/covid-chestxray-dataset


  • 美国国家生物技术信息中心病毒数据库
    https://www.ncbi.nlm.nih.gov/labs/virus/vssi/#/virus?SeqType_s=Nucleotide&VirusLineage_ss=Severe%20acute%20respiratory%20syndrome%20coronavirus%202,%20taxid:2697049


  • COVID-19 开放研究数据集
    https://registry.opendata.aws/cord-19/


  • COVID-19 数据科学:韩国数据集
    https://github.com/ThisIsIsaac/Data-Science-for-COVID-19


  • 印度卫生和家庭福利部: COVID-19 印度
    https://www.mohfw.gov.in/


  • 民防部网址-冠状病毒紧急情况
    https://github.com/pcm-dpc/COVID-19


  • COVID-19 印度尼西亚的数据科学
    https://www.kaggle.com/ardisragen/indonesia-coronavirus-cases


  • 凯撒健康:美国医院 ICU 病床
    https://khn.org/news/as-coronavirus-spreads-widely-millions-of-older-americans-live-in-counties-with-no-icu-beds/#lookup


  • HealthData.org :美国医院容量
    https://covid19.healthdata.org/united-states-of-america


  • 美国环保局:美国空气质量
    https://aqs.epa.gov/aqsweb/documents/data_api.html


  • 美国人口普查局:人口数据
    https://data.census.gov/cedsci/


  • IEEE: COVID-19 Tweets 数据集
    https://ieee-dataport.org/open-access/corona-virus-covid-19-tweets-dataset


  • 华盛顿大学: COVID-19
    https://covid19.healthdata.org/united-states-of-america


  • 凯撒家庭基金会:社会距离政策
    https://www.kff.org/health-costs/issue-brief/state-data-and-policy-actions-to-address-coronavirus/#socialdistancing


新冠肺炎( COVID-19 )开放数据源

不久前,为了对抗蔓延全球的新冠肺炎疫情,帮助研究者、政策制定者、医疗工作者和普通民众更深入地了解病毒和疫情,清华大学联合中国工程科技知识中心、清华大学附属北京长庚医院、阿里巴巴智能计算实验室、北京智源人工智能研究院数据开放研究中心、搜狗搜索、智谱.AI共同上线了“新冠肺炎( COVID-19 )开放数据源”



新冠肺炎( COVID-19 )开放数据源,自疫情发端即致力于收集来自世界各地各种类型的相关开放数据,并保持持续更新。 数据源涵盖流行病研究、知识、媒体和政策等多个领域,目前已收集 194 条开放数据源。

感兴趣的“业余流行病学家”们,可以复制网址(https://www.aminer.cn/data-covid19/)或点击文末阅读原文,一键直达新冠肺炎( COVID-19 )开放数据源专题页面。


参考资料:
https://www.zdnet.com/article/tableau-makes-johns-hopkins-coronavirus-data-available-for-the-rest-of-us/
https://www.zdnet.com/article/as-covid-19-data-sets-become-more-accessible-novel-coronavirus-pandemic-may-be-most-visualized-ever/

近期精彩集锦——
【2020科技趋势】: 《2020科技趋势报告》
【AI女神】: 《AI全球最具影响力女性学者报告》
【AI10】: 《浅谈人工智能下一个十年》
【GNN】: 《图神经网络及认知推理》
【AI指数】: 《2019人工智能指数报告》

【3D视觉】:《3D视觉技术白皮书》

点击上方蓝色字体跳转阅读,对话框回复关键词获取资料!


点击阅读原文,一键直达新冠肺炎( COVID-19 )开放数据源专题!

登录查看更多
0

相关内容

计算机视觉用于新冠病毒COVID-19的控制综述,25页pdf
专知会员服务
52+阅读 · 2020年4月22日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
164+阅读 · 2020年2月27日
别找了,送你 20 个文本数据集
机器学习算法与Python学习
67+阅读 · 2019年5月17日
20个安全可靠的免费数据源,各领域数据任你挑
机器学习算法与Python学习
12+阅读 · 2019年5月9日
机器学习数据集哪里找:优秀数据集来源盘点
云栖社区
10+阅读 · 2019年1月30日
干货下载 | 中文自然语言处理 语料/数据集
七月在线实验室
30+阅读 · 2018年12月27日
资源 | 一份非常全面的开源数据集
黑龙江大学自然语言处理实验室
10+阅读 · 2018年9月7日
下载 ‖ 十大医疗数据集
机械鸡
103+阅读 · 2017年8月5日
Generating Fact Checking Explanations
Arxiv
9+阅读 · 2020年4月13日
Arxiv
20+阅读 · 2019年11月23日
Arxiv
4+阅读 · 2018年12月20日
VIP会员
相关VIP内容
计算机视觉用于新冠病毒COVID-19的控制综述,25页pdf
专知会员服务
52+阅读 · 2020年4月22日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
164+阅读 · 2020年2月27日
相关资讯
别找了,送你 20 个文本数据集
机器学习算法与Python学习
67+阅读 · 2019年5月17日
20个安全可靠的免费数据源,各领域数据任你挑
机器学习算法与Python学习
12+阅读 · 2019年5月9日
机器学习数据集哪里找:优秀数据集来源盘点
云栖社区
10+阅读 · 2019年1月30日
干货下载 | 中文自然语言处理 语料/数据集
七月在线实验室
30+阅读 · 2018年12月27日
资源 | 一份非常全面的开源数据集
黑龙江大学自然语言处理实验室
10+阅读 · 2018年9月7日
下载 ‖ 十大医疗数据集
机械鸡
103+阅读 · 2017年8月5日
Top
微信扫码咨询专知VIP会员