数据科学如何用于理解COVID-19(附链接)

2020 年 4 月 25 日 THU数据派

作者:Kayla Matthews

翻译:陈超


本文约1800字,建议阅读5分钟。

本文为你介绍数据科学如何用于更好地学习和理解COVID-19。

阅读这篇概览,你将获得对数据科学家们是如何努力理解COVID-19拥有更清楚的认识。


图片来源:联合国


随着新型冠状病毒的升级,COVID-19的迅速传播和全球性的影响使得人们感到无助和恐惧,并迫使人们在日常生活的诸多方面都发生了变化。

然而,人们仍然可以通过了解数据科学家们在学习COVID-19上的努力,在这些不确定的时期感受到一丝希望的曙光。

数据科学能够给出冠状病毒的精确图片
 
医疗专家和其他人必须获得关于冠状病毒日常变化的正确并且最新的信息。包括约翰·霍普金斯大学,IBM和Tableau在内的几个组织已经发布了可以提供病毒发病情况的实时观测交互式数据库。

这些资源中的大多数的数据来源是想美国疾病控制和预防中心(CDC)和世界卫生组织(WHO)这样值得信任的机构。数据来源也包括了直接导向这些机构的链接,以便于人们拥有更快捷、容易的方法获得可信赖的信息。

使用这些数据库能够告知人们确诊病例、死亡情况以及治愈情况。无论一个人是在抗疫的前线还是想保持信息畅通的热心公民,他们能够通过同一种途径来获得他们想知道的全部或者大部分信息。

数据科学家们设计了一种更快捷追踪接触者的方法

接触者追踪是一种减缓COVID-19传播的有效方式,包括与病毒检测呈阳性个体的密切接触者取得联系以及告知他们自我隔离。追踪接触者是耗时的,但是当采取严格社交距离的人们的数量开始增加时会变得相对容易一些。

牛津大学的一批数据科学家以及医疗专家们集结起来,使得接触者追踪变得更为高效。这些专家通过数学模型表明在公共健康领域使用传统方法进行接触者追踪并不能够快速彻底地延缓COVID-19的传播。

他们提出了一个基于移动手机端的解决方案,以代替人们手动联系接触者们的需求。取而代之的是,这些人会收到确认需要自我隔离的短信。研究者们认为,如果可以得到国家领导者们的支持而不是由独立的APP开发人员主导的话,他们的方法将会是最高效的。

至今没有国家使用这种方法。但是考虑到手机的市场渗透以及人们接受短信的熟悉度,该方法能够起效的原因显而易见。

每个人都能为科学家们对抗冠状病毒出力

许多感染COVID-19的人仅出现轻症或者没有任何症状。并且,典型的症状是发烧和咳嗽——但这两个问题并不限于冠状病毒感染。因此这会让疾病在人们没有意识到的情况下发生感染。但是,开发者们设计了一款使用数据共享来帮助医疗专家们更好地了解病毒的APP。

这款名为病毒症状追踪器(Covid Symptom Tracker)的APP已经拥有了至少200000名用户。人们可以与APP进行交互,及时他们无症状或者不认为自己的症状与COVID-19相关。研究者们对冠状病毒了解得越多,越有助于他们应对它。

人们的交互过程是做一个日常简单的症状登记。他们也会填写自己的年龄和邮编,并告知先前的状况。那些信息可以帮助科学家们决定是否人群最易感或者处于风险之中。APP并不会将用户信息用于商业目的,但是会将信息发送给那些正在组织病毒传播的人,包括一些健康组织。

数据科学家们使用机器学习来快速寻找最可能的治疗方法

除了与限制COVID-19的传播赛跑,科学家们也在努力尽可能快地找到有效的治疗方法。哥伦比亚大学两名数据科学的研究生向机器学习来寻求帮助。典型的抗体研制过程需要耗费几年的时间。而这种方法只需要几周就可以筛选出高成功率的治疗抗体。

该团队说这种方法比传统方法的成本也更低。目前人们仍处在研发过程当中,因为他们必须测试通过机器学习算法识别出的基因序列是有希望成功的。然而,使用这种快速的方法找到对冠状病毒患者有效的干预措施可能仍是至关重要的。

数据科学可用于帮助追踪传播轨迹

数据科学专家也得出结论,图表数据库也对他们了解COVID-19的传播有帮助。图表数据库表明人、地点或者事物之间的联系。科学家们将这些实体作为节点,他们之间的联系作为“边”。就可以给出一个事物联系之间可视化的表征,如果彼此间有联系的话。

在冠状病毒爆发的早期阶段,中国的数据科学家们建立了一个叫做流行病传播(Epidemic Spread)的图表数据库工具。人们可以输入与他们的旅程相关的可识别信息,比如航班号或者车牌号。数据库就能够告诉这些用户是否有确诊患者与他们有相同的行程,并且可能传播给他们同行的旅客。

在COVID-19上取得进展

尽可能多地了解冠状病毒将会挽救生命。以上列举的这些仅仅是数据科学家们运用自己的技能提供帮助的部分有趣的方式。

原文标题:
How Data Science Is Being Used to Understand COVID-19
原文链接:
https://www.kdnuggets.com/2020/04/data-science-understand-covid-19.html




译者简介




陈超,北京大学应用心理硕士在读。本科曾混迹于计算机专业,后又在心理学的道路上不懈求索。越来越发现数据分析和编程已然成为了两门必修的生存技能,因此在日常生活中尽一切努力更好地去接触和了解相关知识,但前路漫漫,我仍在路上。


——END——


登录查看更多
1

相关内容

COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
42+阅读 · 2020年7月2日
专知会员服务
171+阅读 · 2020年6月4日
计算机视觉用于新冠病毒COVID-19的控制综述,25页pdf
专知会员服务
52+阅读 · 2020年4月22日
【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
35+阅读 · 2020年4月5日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
20个安全可靠的免费数据源,各领域数据任你挑
机器学习算法与Python学习
12+阅读 · 2019年5月9日
产品总监如何管理团队,搭建一个强大的队伍?
人人都是产品经理
17+阅读 · 2018年12月19日
50个“杀手级”AI项目 !(附链接)
数据派THU
3+阅读 · 2018年2月25日
数据科学与机器学习数据集
Datartisan数据工匠
8+阅读 · 2017年12月14日
Mozilla发布开源语音数据库和语音识别模型
Python程序员
3+阅读 · 2017年12月1日
关于孩子的未来,汪涵和李锐想告诉你这些......
三联生活周刊
6+阅读 · 2017年10月28日
文本聚类:从非结构化数据快速获取见解
Datartisan数据工匠
15+阅读 · 2017年10月12日
Arxiv
3+阅读 · 2018年10月5日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
5+阅读 · 2018年6月12日
Arxiv
4+阅读 · 2018年5月24日
VIP会员
相关资讯
20个安全可靠的免费数据源,各领域数据任你挑
机器学习算法与Python学习
12+阅读 · 2019年5月9日
产品总监如何管理团队,搭建一个强大的队伍?
人人都是产品经理
17+阅读 · 2018年12月19日
50个“杀手级”AI项目 !(附链接)
数据派THU
3+阅读 · 2018年2月25日
数据科学与机器学习数据集
Datartisan数据工匠
8+阅读 · 2017年12月14日
Mozilla发布开源语音数据库和语音识别模型
Python程序员
3+阅读 · 2017年12月1日
关于孩子的未来,汪涵和李锐想告诉你这些......
三联生活周刊
6+阅读 · 2017年10月28日
文本聚类:从非结构化数据快速获取见解
Datartisan数据工匠
15+阅读 · 2017年10月12日
Top
微信扫码咨询专知VIP会员