武汉新冠肺炎传播的动力学模型及预测

2020 年 2 月 1 日 THU数据派

转载自：绿墨水社区

本文2713字，建议阅读 5分钟。

本文介绍采用国家公布的疫情数据，构建动力学模型来预测全国、武汉和上海的新型肺炎疫情扩散情况和关键节点时间。

在千万网友的关注下，雷神山医院的建设工人争分夺秒、鏖战正酣，而在看不见的地方，众多科研力量也早已应急攻关，以绝后患。在这场前所未有的黑天鹅事件下，有一股力量驱使着每一个人伸出援手，团结一致，共克时艰。作为其中的一份子，我们也希望能贡献自己的绵薄之力。武汉加油！中国加油！

题图 | 央视网

我们是很普通的一群研究者，尝试用掌握的知识帮助大家掌握疫情的发展动态，了解周围每一个人和国家为疫情控制所做努力的成效。因此我们采用国家公布的疫情数据，构建了动力学模型来预测全国、武汉和上海的新型肺炎疫情扩散情况和关键节点时间。结果显示，此模型在理论上可以较好地提前1天预测全国和重点城市疫情人数。

根据截止1月30日的疫情数据预测结果如下：

主要发现一

预测全国疫情有可能在2月5日-8日左右达到爆发增长的拐点并在3月20日基本结束。

主要发现二

各地政府的有效防控措施使得易感人群减少暴露，切实有效地减少了易感人群的数量。

P1. 模型拟合与预测误差评估

模型采用1月16日至1月27日[1]国家卫生应急办公室和湖北省卫生健康委员会公布的疫情数据[2]。为了检验模型有效性和稳定性，团队在27日建模完成后，持续对28-30日[3]疫情进行了预测追踪。

结果显示，采用1月16-27日疫情数据的全国疫情模型解释程度（R2）达到99.7%；在此拟合基础上推断，全国疫情拐点将出现在2月8日左右，这与钟南山院士[4]判断的“正月十五之前出现拐点”一致，也和闻玉梅院士提出的疫情出现后“一到两个潜伏期出现拐点”一致。另外，模型推断疫情有可能在3月20日左右基本结束。

武汉疫情拟合度为84.5%[5]，误差相对较高，可能是由于武汉医疗资源相对紧张，导致确诊速度不稳定，确诊统计量受到干扰。

下图展示了1月16日到27日的实际疫情和初步模型预测结果。

注：黑色为实际数据，蓝色为模型预测数据，横轴代表2020年的第N天，纵轴代表被感染人数（确诊数）

然后，团队根据28-30日的实际情况每日检验模型预测有效性。结果显示：模型预测确诊数的误差率分别为7.3%（全国）和10.8%（武汉）。证明模型对未来24小时的确诊数预测较准确。

注：对28-30日的预测分别采用16-27、16-28、16-29日实际疫情进行模型参数估计。

团队同时考察了模型对未来48小时疫情确诊数的预测效果，预测误差分别19.7%（全国）和16.1%（武汉），说明我们的模型对48h预测准确度相对较低，尽管仍旧在20%误差范围内。

注：对29-30日的预测分别采用16-27、16-28日实际疫情进行模型参数估计，即48h预测。

P2. 全国和武汉疫情预测

在确认模型的有效性后，我们采用16-30日的数据对未来进行预测。最终结果显示：

与采用16-27日数据得到的模型结果相比，模型对全国疫情的拟合度提高到99.9%，

预测疫情拐点将提前出现在2月5日-2月6日之间，且峰值人数将有明显下降。

这可能是由于各地政府的有效防控措施，使得易感人群减少暴露，从而切实有效地降低了全国整体的峰值人数，并将拐点提前。

而武汉疫情拟合度提高到了97.2%，说明随着武汉数据的持续发布，武汉疫情越来越可以被我们的模型拟合。但同时我们也关注到，武汉的拐点时间并没有改变，而拐点的感染峰值人数反而在提高，仍有待每日保持紧密和持续的关注。

P3. 上海疫情预测

除了湖北武汉以外，北上广重作为武汉近期重点人员输出城市，具有最高的疫情爆发风险。但这5座城市确诊数据的时间跨度较短，缺乏20日之前的确诊病例数。我们以上海为例进行早期确诊数据填充来粗略估计疫情发展。

基于1月18日至1月28日的确诊数量[6]我们进行模型估计后。结果显示：上海疫情的峰值拐点将在2月6日左右出现， 3月20日左右基本结束，和全国情况相似。

在预测效果上，我们同样以1月29-30日为验证，模型预测确诊病例数分别为101和121，与实际疫情的平均误差率2.7%。下图展示了我们对上海疫情的最新预测。

P4. 尾声

总的来说，我们对疫情防控的发展充满积极乐观的态度，因为我们已经发现和证实各地政府有效防控措施带来的积极效果，对我国人民众志成城打赢这场疫情也充满信心。

但同时我们也在担心：随着春运返程人流的增加，易感人群暴露率可能会增加，疫情很有可能出现反复。在此，我们也真诚地希望大家，信任和积极配合政府所做的各项疫情防控措施，注意采取自我保护措施，在接下来的几天里坚持做好防控，共同促进拐点的提前，在下周能安心地踏上春运的返程。

最后，我们承认工作的局限性。由于模型仅采用有限公开数据进行预测，尽管已经取得了较好的预测效果，但不排除增加更多数据（如人口流动率、医院就诊病患信息、检查周期等）时可以开发更好的模型进行预测。

团队感想

我们在除夕当天获悉全国疫情信息后就自发地收集数据和构建模型，中间得到很多同事朋友的关心和关注。在研究的同时，我们也作为普通人，在上海、成都、武汉、昆明等地切实感受着政府的积极防控措施、周围群众到位的防控意识，以及无数像我们一样的医疗、科研、政府工作人员在春节默默工作。

烦闷工作之余，就是刷刷各地的春节防控段子，感受各地群众乐观向上、百折不挠的生活态度。为了确保研究的严谨性，尽管我们在27号做好了模型和测试，但仍旧留了3天，每天和真实数据对比。除了预测效果的确不错外，还发现推断的拐点在不断提前，峰值人群不断下降。只要不出现异常复发（比如春运返程），我们是积极乐观的，也希望这份晚到了三天的乐观能传播出去，为我们每日生活的祖国带来更加多的正能量：）

我们计划接下来每日持续改进模型和更新预测数据，为我国打好此次疫情的攻坚战，帮助社会了解到国家为疫情控制所做努力的成效，帮助广大人民群众科学了解疫情的未来发展，尽到自己的一份力量。

一群共同努力着的普通研究者：邓皓文、张诚、刘雷、何云刚、钟凡、张琦和王琳。