转载自:绿墨水社区
在千万网友的关注下,雷神山医院的建设工人争分夺秒、鏖战正酣,而在看不见的地方,众多科研力量也早已应急攻关,以绝后患。在这场前所未有的黑天鹅事件下,有一股力量驱使着每一个人伸出援手,团结一致,共克时艰。作为其中的一份子,我们也希望能贡献自己的绵薄之力。武汉加油!中国加油!
题图 | 央视网
我们是很普通的一群研究者,尝试用掌握的知识帮助大家掌握疫情的发展动态,了解周围每一个人和国家为疫情控制所做努力的成效。因此我们采用国家公布的疫情数据,构建了动力学模型来预测全国、武汉和上海的新型肺炎疫情扩散情况和关键节点时间。结果显示,此模型在理论上可以较好地提前1天预测全国和重点城市疫情人数。
根据截止1月30日的疫情数据预测结果如下:
主要发现一
预测全国疫情有可能在2月5日-8日左右达到爆发增长的拐点并在3月20日基本结束。
主要发现二
各地政府的有效防控措施使得易感人群减少暴露,切实有效地减少了易感人群的数量。
P1. 模型拟合与预测误差评估
模型采用1月16日至1月27日[1]国家卫生应急办公室和湖北省卫生健康委员会公布的疫情数据[2]。为了检验模型有效性和稳定性,团队在27日建模完成后,持续对28-30日[3]疫情进行了预测追踪。
结果显示,采用1月16-27日疫情数据的全国疫情模型解释程度(R2)达到99.7%;在此拟合基础上推断,全国疫情拐点将出现在2月8日左右,这与钟南山院士[4]判断的“正月十五之前出现拐点”一致,也和闻玉梅院士提出的疫情出现后“一到两个潜伏期出现拐点”一致。另外,模型推断疫情有可能在3月20日左右基本结束。
武汉疫情拟合度为84.5%[5],误差相对较高,可能是由于武汉医疗资源相对紧张,导致确诊速度不稳定,确诊统计量受到干扰。
下图展示了1月16日到27日的实际疫情和初步模型预测结果。
注:黑色为实际数据,蓝色为模型预测数据,横轴代表2020年的第N天,纵轴代表被感染人数(确诊数)
然后,团队根据28-30日的实际情况每日检验模型预测有效性。结果显示:模型预测确诊数的误差率分别为7.3%(全国)和10.8%(武汉)。证明模型对未来24小时的确诊数预测较准确。
注:对28-30日的预测分别采用16-27、16-28、16-29日实际疫情进行模型参数估计。
团队同时考察了模型对未来48小时疫情确诊数的预测效果,预测误差分别19.7%(全国)和16.1%(武汉),说明我们的模型对48h预测准确度相对较低,尽管仍旧在20%误差范围内。
注:对29-30日的预测分别采用16-27、16-28日实际疫情进行模型参数估计,即48h预测。
P2. 全国和武汉疫情预测
在确认模型的有效性后,我们采用16-30日的数据对未来进行预测。最终结果显示:
1 |
与采用16-27日数据得到的模型结果相比,模型对全国疫情的拟合度提高到99.9%, |
2 |
预测疫情拐点将提前出现在2月5日-2月6日之间,且峰值人数将有明显下降。 |
这可能是由于各地政府的有效防控措施,使得易感人群减少暴露,从而切实有效地降低了全国整体的峰值人数,并将拐点提前。
而武汉疫情拟合度提高到了97.2%,说明随着武汉数据的持续发布,武汉疫情越来越可以被我们的模型拟合。但同时我们也关注到,武汉的拐点时间并没有改变,而拐点的感染峰值人数反而在提高,仍有待每日保持紧密和持续的关注。
P3. 上海疫情预测
除了湖北武汉以外,北上广重作为武汉近期重点人员输出城市,具有最高的疫情爆发风险。但这5座城市确诊数据的时间跨度较短,缺乏20日之前的确诊病例数。我们以上海为例进行早期确诊数据填充来粗略估计疫情发展。
基于1月18日至1月28日的确诊数量[6]我们进行模型估计后。结果显示:上海疫情的峰值拐点将在2月6日左右出现, 3月20日左右基本结束,和全国情况相似。
在预测效果上,我们同样以1月29-30日为验证,模型预测确诊病例数分别为101和121,与实际疫情的平均误差率2.7%。下图展示了我们对上海疫情的最新预测。
P4. 尾声
总的来说,我们对疫情防控的发展充满积极乐观的态度,因为我们已经发现和证实各地政府有效防控措施带来的积极效果,对我国人民众志成城打赢这场疫情也充满信心。
但同时我们也在担心:随着春运返程人流的增加,易感人群暴露率可能会增加,疫情很有可能出现反复。在此,我们也真诚地希望大家,信任和积极配合政府所做的各项疫情防控措施,注意采取自我保护措施,在接下来的几天里坚持做好防控,共同促进拐点的提前,在下周能安心地踏上春运的返程。
最后,我们承认工作的局限性。由于模型仅采用有限公开数据进行预测,尽管已经取得了较好的预测效果,但不排除增加更多数据(如人口流动率、医院就诊病患信息、检查周期等)时可以开发更好的模型进行预测。
团队感想
我们在除夕当天获悉全国疫情信息后就自发地收集数据和构建模型,中间得到很多同事朋友的关心和关注。在研究的同时,我们也作为普通人,在上海、成都、武汉、昆明等地切实感受着政府的积极防控措施、周围群众到位的防控意识,以及无数像我们一样的医疗、科研、政府工作人员在春节默默工作。
烦闷工作之余,就是刷刷各地的春节防控段子,感受各地群众乐观向上、百折不挠的生活态度。为了确保研究的严谨性,尽管我们在27号做好了模型和测试,但仍旧留了3天,每天和真实数据对比。除了预测效果的确不错外,还发现推断的拐点在不断提前,峰值人群不断下降。只要不出现异常复发(比如春运返程),我们是积极乐观的,也希望这份晚到了三天的乐观能传播出去,为我们每日生活的祖国带来更加多的正能量 :)
我们计划接下来每日持续改进模型和更新预测数据,为我国打好此次疫情的攻坚战,帮助社会了解到国家为疫情控制所做努力的成效,帮助广大人民群众科学了解疫情的未来发展,尽到自己的一份力量。
一群共同努力着的普通研究者:邓皓文、张诚、刘雷、何云刚、钟凡、张琦和王琳。
附注:
[1] 国家卫生应急办公室自1月20日才开始公布全国确诊病例数,其中武汉外共33例,故用武汉1月16日至19日的确诊数代表全国以增加数据量。武汉15日之前的确证病例数与疫情扩散通常呈现的指数增长趋势不符,暂忽略。
[2] 全国卫生应急办公室http://www.nhc.gov.cn/yjb/new_index.shtml,
湖北省卫生健康委员会 http://wjw.hubei.gov.cn/
[3] 29日的预测基于模型在更新28日数据的基础上改进参数后的结果,30日的预测基于模型在更新29日数据的基础上改进参数后的结果,以此类推。
[4] https://tech.ifeng.com/c/7tdDNY8MUGA
[5] 从武汉疫情数据来看,前期披露数据近似线性增长,但近日出现指数型上涨,和全国疫情扩散规律不太一样。
[6] 上海市卫生健康委员会 http://wsjkw.sh.gov.cn/
——END——