我国疫情预测模型遭权威期刊退回!钟南山等人用 LSTM 力证“早发现早隔离”重要性

2020 年 3 月 3 日 AI科技评论
业界大牛也可能会面临被同行审批毙稿、被期刊退稿的局面。

作者 | Rachel 
编辑 | 贾伟

对病毒在人群中传播的智能预测模型构建与验证是当前的工作重点。

不过,在 2020 年 2 月 27 日广州市政府新闻办举办的疫情防控专场新闻通气会上,钟南山院士在谈到疫情的预测时表示:

疫情开始时,国外有流行病学家用权威的试验模型,预测 2 月初中国感染新冠肺炎人数将达 16 万人。这是没有考虑到国家的强力干预,也没有考虑春节后的延迟复工,我们也做了预测模型,2 月中旬或下旬达到疫情高峰,确诊病例约六、七万人,投到国外权威期刊,被退了回来,感觉和上面的预测水平差太多,还有人给我发微信说“你的话几天之内就会被碾个粉碎”。但事实上,我们的预测更接近权威。

1、西方的傲慢与偏见?

钟南山院士此言一出,引发网友热议。

一方面,不少网友认为包括权威期刊审稿人在内的众多西方学者带有预设立场,因此投稿被退可以说是一种恶意揣测。

另一方面,网友认为由于社会背景、文化、制度等方面的差异,出现所谓的“偏见”也无可厚非。正如钟南山院士所说,国外并不了解我国国情,没有考虑到国家的强力干预和春节后的延迟复工起到的积极作用。

Source:新浪微博

AI 科技评论注意到,虽然钟南山院士并未详细介绍被退回的疾病预测模型,但知乎一位名为“疯狂绅士”的计算机软件背景人士认为,钟南山院士的模型叫「具有饱和发病率 SIQS 传染病模型」。根据其解释,任何传染病都具有饱和发病率,即不可能完全被消灭。

该网友提到,SIQS 实际就是在 SEIR 的基础上加入了干预手段(比如这里就指国家利用早发现、早隔离的手段进行了强烈干预)。而所谓的 SEIR 正是一种常见的传染病模型,此前有关 SARS 的传播动力学研究大多也都采用了 SEIR 模型。

Source:百度百科

实际上,这一表述也与钟南山院士当天在会上的观点类似:

我们在传统模型基础上加上两个影响因素,第一个是国家强力干预,第二个是春节后的回程高峰。

2、利用 AI 以 SARS 数据为基础进行训练

另外AI科技评论了解到,2020 年 2 月 28 日,钟南山院士等人在医学期刊 JTD 发表了一篇名为《公共卫生干预下 COVID-19 流行趋势的 SEIR 和 AI 预测修正》(Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions)的论文。

根据论文,研究团队将 2020 年 1 月 23 日前后的人口迁移数据及最新的新冠肺炎流行病学数据整合到 SEIR 模型中导出流行曲线。值得一提的是,团队还利用 AI ,以 2003 年 SARS 数据为基础进行训练,从而更好地预测新冠疫情。

具体来讲,研究人员通过引入移入参数 In(t)和移出参数 Out(t)修改了原始 SEIR 方程,进而解释动态易感 [S] 和暴露 [E] 种群状态。修改后的模型如下图。

值得一提的是,研究团队使用 LSTM(长短期记忆)模型——一种用于处理、预测各种时间序列问题的循环神经网络(RNN),预测新增感染数随时间的变化。

对于基本训练数据集,研究团队使用了 2003 年 4-6 月 SARS 的病例统计,同时纳入 COVID-19 流行病学参数,如传染概率 b、传染系数(率)β、潜伏率 σ、退出率 γ 等。

此外,由于数据集相对较小,团队开发了更简单的网络结构防止过拟合,并使用 Adam 优化器优化模型并迭代 500次。

根据上述方法,研究团队预测,疫情将在 2 月底达到高峰,并在 4 月底得到基本控制。同时,如果国家实施的干预措施推迟 5 天,中国大陆的疫情规模将增加 3 倍;如果取消湖北检疫站点,将导致湖北省在 3 月中旬出现第二次疫情高峰,同时疫情可能持续至 4 月下旬——这些结果都得到了机器学习预测的证实。


在AI 科技评论看来,对于我国预测模型被国外权威期刊退回一事,我们应该持一个更加开放的态度,毕竟国内外预测模型的准确性孰优孰劣尚未可知。而且,被期刊退稿在科研过程中也并不稀奇,疫情当前,科学工作者的国别、立场不该是我们最关心的问题。

参考资料:
https://www.zhihu.com/question/375257984
http://jtd.amegroups.com/article/view/36385



登录查看更多
2

相关内容

长短期记忆网络(LSTM)是一种用于深度学习领域的人工回归神经网络(RNN)结构。与标准的前馈神经网络不同,LSTM具有反馈连接。它不仅可以处理单个数据点(如图像),还可以处理整个数据序列(如语音或视频)。例如,LSTM适用于未分段、连接的手写识别、语音识别、网络流量或IDSs(入侵检测系统)中的异常检测等任务。
【快讯】KDD2020论文出炉,216篇上榜, 你的paper中了吗?
专知会员服务
50+阅读 · 2020年5月16日
专知会员服务
27+阅读 · 2020年3月6日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
论文h-index过低,ACL2020主席遭匿名攻击
新智元
4+阅读 · 2019年7月12日
2018-2019中国智能手机品牌东南亚市场研究报告
行业研究报告
3+阅读 · 2019年5月14日
KDD 2019放榜,接收率低至14%,你的论文中了吗?
机器之心
7+阅读 · 2019年4月30日
论文解析 | Google如何用CNN检查乳腺癌?
AI100
4+阅读 · 2017年12月21日
干细胞外泌体的市场分析
外泌体之家
8+阅读 · 2017年12月19日
Arxiv
15+阅读 · 2020年2月6日
Arxiv
24+阅读 · 2018年10月24日
VIP会员
相关VIP内容
【快讯】KDD2020论文出炉,216篇上榜, 你的paper中了吗?
专知会员服务
50+阅读 · 2020年5月16日
专知会员服务
27+阅读 · 2020年3月6日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
Top
微信扫码咨询专知VIP会员