武汉新冠肺炎传播的动力学模型及预测

2020 年 2 月 1 日 THU数据派

转载自:绿墨水社区


本文2713,建议阅读 5
本文介绍 采用国家公布的疫情数据,构建动力学模型来预测全国、武汉和上海的新型肺炎疫情扩散情况和关键节点时间。

在千万网友的关注下,雷神山医院的建设工人争分夺秒、鏖战正酣,而在看不见的地方,众多科研力量也早已应急攻关,以绝后患。在这场前所未有的黑天鹅事件下,有一股力量驱使着每一个人伸出援手,团结一致,共克时艰。作为其中的一份子,我们也希望能贡献自己的绵薄之力。武汉加油!中国加油!


题图 | 央视网


我们是很普通的一群研究者,尝试用掌握的知识帮助大家掌握疫情的发展动态,了解周围每一个人和国家为疫情控制所做努力的成效。因此我们采用国家公布的疫情数据,构建了动力学模型来预测全国、武汉和上海的新型肺炎疫情扩散情况和关键节点时间。结果显示,此模型在理论上可以较好地提前1天预测全国和重点城市疫情人数。


根据截止1月30日的疫情数据预测结果如下:


主要发现一

预测全国疫情有可能在2月5日-8日左右达到爆发增长的拐点并在3月20日基本结束。

主要发现二

各地政府的有效防控措施使得易感人群减少暴露,切实有效地减少了易感人群的数量。


P1. 模型拟合与预测误差评估


模型采用1月16日至1月27日[1]国家卫生应急办公室和湖北省卫生健康委员会公布的疫情数据[2]。为了检验模型有效性和稳定性,团队在27日建模完成后,持续对28-30日[3]疫情进行了预测追踪。


结果显示,采用1月16-27日疫情数据的全国疫情模型解释程度(R2)达到99.7%;在此拟合基础上推断,全国疫情拐点将出现在2月8日左右,这与钟南山院士[4]判断的“正月十五之前出现拐点”一致,也和闻玉梅院士提出的疫情出现后“一到两个潜伏期出现拐点”一致。另外,模型推断疫情有可能在3月20日左右基本结束


武汉疫情拟合度为84.5%[5],误差相对较高,可能是由于武汉医疗资源相对紧张,导致确诊速度不稳定,确诊统计量受到干扰。 


下图展示了1月16日到27日的实际疫情和初步模型预测结果。


注:黑色为实际数据,蓝色为模型预测数据,横轴代表2020年的第N天,纵轴代表被感染人数(确诊数)


然后,团队根据28-30日的实际情况每日检验模型预测有效性。结果显示:模型预测确诊数的误差率分别为7.3%(全国)和10.8%(武汉)。证明模型对未来24小时的确诊数预测较准确。


注:对28-30日的预测分别采用16-27、16-28、16-29日实际疫情进行模型参数估计。


团队同时考察了模型对未来48小时疫情确诊数的预测效果,预测误差分别19.7%(全国)和16.1%(武汉),说明我们的模型对48h预测准确度相对较低,尽管仍旧在20%误差范围内。


注:对29-30日的预测分别采用16-27、16-28日实际疫情进行模型参数估计,即48h预测。


P2. 全国和武汉疫情预测


在确认模型的有效性后,我们采用16-30日的数据对未来进行预测。最终结果显示:


1


与采用16-27日数据得到的模型结果相比,模型对全国疫情的拟合度提高到99.9%

2


预测疫情拐点将提前出现在2月5日-2月6日之间,且峰值人数将有明显下降。


这可能是由于各地政府的有效防控措施,使得易感人群减少暴露,从而切实有效地降低了全国整体的峰值人数,并将拐点提前。


而武汉疫情拟合度提高到了97.2%,说明随着武汉数据的持续发布,武汉疫情越来越可以被我们的模型拟合。但同时我们也关注到,武汉的拐点时间并没有改变,而拐点的感染峰值人数反而在提高,仍有待每日保持紧密和持续的关注。


P3. 上海疫情预测


了湖北武汉以外,北上广重作为武汉近期重点人员输出城市,具有最高的疫情爆发风险。但这5座城市确诊数据的时间跨度较短,缺乏20日之前的确诊病例数。我们以上海为例进行早期确诊数据填充来粗略估计疫情发展。


基于1月18日至1月28日的确诊数量[6]我们进行模型估计后。结果显示:上海疫情的峰值拐点将在2月6日左右出现, 3月20日左右基本结束,和全国情况相似。


在预测效果上,我们同样以1月29-30日为验证,模型预测确诊病例数分别为101和121,与实际疫情的平均误差率2.7%。下图展示了我们对上海疫情的最新预测。



P4. 尾声


总的来说,我们对疫情防控的发展充满积极乐观的态度,因为我们已经发现和证实各地政府有效防控措施带来的积极效果,对我国人民众志成城打赢这场疫情也充满信心。


但同时我们也在担心:随着春运返程人流的增加,易感人群暴露率可能会增加,疫情很有可能出现反复。在此,我们也真诚地希望大家,信任和积极配合政府所做的各项疫情防控措施,注意采取自我保护措施,在接下来的几天里坚持做好防控,共同促进拐点的提前,在下周能安心地踏上春运的返程。


最后,我们承认工作的局限性。由于模型仅采用有限公开数据进行预测,尽管已经取得了较好的预测效果,但不排除增加更多数据(如人口流动率、医院就诊病患信息、检查周期等)时可以开发更好的模型进行预测。





团队感想

我们在除夕当天获悉全国疫情信息后就自发地收集数据和构建模型,中间得到很多同事朋友的关心和关注。在研究的同时,我们也作为普通人,在上海、成都、武汉、昆明等地切实感受着政府的积极防控措施、周围群众到位的防控意识,以及无数像我们一样的医疗、科研、政府工作人员在春节默默工作。


烦闷工作之余,就是刷刷各地的春节防控段子,感受各地群众乐观向上、百折不挠的生活态度。为了确保研究的严谨性,尽管我们在27号做好了模型和测试,但仍旧留了3天,每天和真实数据对比。除了预测效果的确不错外,还发现推断的拐点在不断提前,峰值人群不断下降。只要不出现异常复发(比如春运返程),我们是积极乐观的,也希望这份晚到了三天的乐观能传播出去,为我们每日生活的祖国带来更加多的正能量 :)


我们计划接下来每日持续改进模型和更新预测数据,为我国打好此次疫情的攻坚战,帮助社会了解到国家为疫情控制所做努力的成效,帮助广大人民群众科学了解疫情的未来发展,尽到自己的一份力量。


一群共同努力着的普通研究者:邓皓文、张诚、刘雷、何云刚、钟凡、张琦和王琳。




附注:

[1] 国家卫生应急办公室自1月20日才开始公布全国确诊病例数,其中武汉外共33例,故用武汉1月16日至19日的确诊数代表全国以增加数据量。武汉15日之前的确证病例数与疫情扩散通常呈现的指数增长趋势不符,暂忽略。

[2] 全国卫生应急办公室http://www.nhc.gov.cn/yjb/new_index.shtml, 

北省卫生健康委员会 http://wjw.hubei.gov.cn/

[3] 29日的预测基于模型在更新28日数据的基础上改进参数后的结果,30日的预测基于模型在更新29日数据的基础上改进参数后的结果,以此类推。

[4] https://tech.ifeng.com/c/7tdDNY8MUGA

[5] 从武汉疫情数据来看,前期披露数据近似线性增长,但近日出现指数型上涨,和全国疫情扩散规律不太一样。

[6] 上海市卫生健康委员会 http://wsjkw.sh.gov.cn/


——END——



登录查看更多
0

相关内容

专知会员服务
27+阅读 · 2020年3月6日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
96+阅读 · 2020年1月21日
北京市通勤出行特征与典型区域分析
智能交通技术
28+阅读 · 2019年7月19日
报名 | 首届事理图谱研讨会
哈工大SCIR
18+阅读 · 2019年7月5日
基于 Carsim 2016 和 Simulink的无人车运动控制联合仿真(三)
人工智能能够预测地震吗?
人工智能学家
7+阅读 · 2018年12月10日
魔都要用最先进的神经网络预测交通?前排围观
机器之心
8+阅读 · 2018年11月15日
如何用TensorFlow预测时间序列:TFTS库详细教程
人工智能头条
9+阅读 · 2017年8月30日
Arxiv
6+阅读 · 2018年10月3日
Arxiv
9+阅读 · 2018年3月23日
Arxiv
6+阅读 · 2018年3月12日
Arxiv
3+阅读 · 2018年1月10日
VIP会员
相关VIP内容
专知会员服务
27+阅读 · 2020年3月6日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
96+阅读 · 2020年1月21日
相关资讯
北京市通勤出行特征与典型区域分析
智能交通技术
28+阅读 · 2019年7月19日
报名 | 首届事理图谱研讨会
哈工大SCIR
18+阅读 · 2019年7月5日
基于 Carsim 2016 和 Simulink的无人车运动控制联合仿真(三)
人工智能能够预测地震吗?
人工智能学家
7+阅读 · 2018年12月10日
魔都要用最先进的神经网络预测交通?前排围观
机器之心
8+阅读 · 2018年11月15日
如何用TensorFlow预测时间序列:TFTS库详细教程
人工智能头条
9+阅读 · 2017年8月30日
Top
微信扫码咨询专知VIP会员