万人核酸太烦人?复旦博士生李小康写下130行代码取代人工!

2022 年 4 月 10 日 新智元



  新智元报道  

编辑:时光

【新智元导读】

高校辅导员将被机器取代?

复旦信息博士生李小康用130行代码轻松搞定万人核酸大核查,这位学神是怎么做到的?


今天,上海疫情继续牵动着全国人民的心。

 

 

总有一种力量,让无力者有力,让悲观者前行,灾难面前,人们更加团结起来,群策群力抵抗疫情。

 

作为上海市的一颗耀眼明珠,复旦大学这座巍巍学府在学生管理上追求智能化,即便在班级核酸统计这件简单而机械的小事上,复旦的知识精英们也在努力做到更加高效,从而节省出更多的时间和精力,让师生们得以安心学习。

 

最近,「复旦博士用130行代码搞定核酸统计」的新闻冲上热搜,这样的正能量传播,给疫情的慌乱与抱怨声中注入了淡定与希望,连《人民日报》都点赞:知识就是力量!

 

 

青年有识之士向来是祖国的未来与希望,复旦造就的好学力行的青年学子,堪称国之栋梁,民之表率。

 

3分钟审核800图


伴随着上海市疫情更加严重,自今年3月初以来,上海市启动常态化核酸筛查工作,复旦大学要求辅导员们,挨个核实、查验班级每一位学生的核酸检测阴性证明,以便阳性病例出现时能够在第一时间上报。
 
(上海健康云核酸截图)
 
查验每一位学生的核酸报告,如果一个班级60名学生,那么,一个个查下来,可能需要半小时。
 
查验时至少需要做到:

第一,确保 姓名 、身份证号码与本人身份无误,不能借用别人的核酸报告混过去;
 
第二,要查验具体的检测时间,如果 核酸时间 必须48小时以内,超出时间则无效;
 
第三,报告必须显示 「阴性」 结果,阳性则必须上报。
 
那么,这里面是否有人篡改截图,对截图进行PS处理,恐怕也会存在这种情况,所以,辅导员最好让学生当面打开程序,即时查看。
 
当核酸查验变成了常态化,人们难免会失去耐心。
 
这样的人工查验,查验双方都觉费时费力,师生为之叫苦。
 
正是在这样的背景下,复旦大学信息科学与工程学院博士生李小康,他希望用自己的 专业知识改变现状
 
他快速开发一项小程序,几分钟就能快速核查数百人的核酸证明截图,大大提高核查效率和精度。
 
 
能够学习致用,何尝不是学习者的一种幸运!
 
原来,80张图,需要一个人审核40分钟。
 
现在,机器不到20秒。
 
原来,800张截图,需要几个人分工审核,几小时才能完成。
 
现在,只需200秒,也就是3分钟多点。

 

智能化「抗疫」神器是如何诞生的?


李小康,复旦信息科学与工程学院在读的博士生,专业为生物医学工程,他平时的研究正是生物医学与信息科学的结合,希望通过 信息化 手段来改变生物医学现状。
 
同时,李小康还担任该学院2019级信息1班辅导员,那么这项核酸查验工作,正是他所需要面对的一项日常行政工作。
 
 
那么,作为一名博士生,他希望用自己多年的专业积累,去改善这项繁琐的日常行政工作,这样,一方面他的专业所长找到了用武之地,另一方面行政工作将变得更加高效有趣。
 
「这个工作听起来好像很简单,但实际做的时候,一个班级的截图可能就需要花上半小时核查,如果是人数多的院系可能需要更久,还可能会错看漏看。」李小康说。
 
李小康觉得,这件事情单调枯燥,费时费力,重复性强的工作正符合计算机程序取代的特点。
 
「智能化」的思维驱使他写下了130行代码。
 
一开始,他先用自己班级的数据校验程序,结果发现,准确率很高,运行时间很短。
 
在上海的高校,像李小康这样的学生辅导员不计其数,除了班级层面之外,学院、学校层面的管理者要面对更多的学生,他们的工作量更大。
 
随后,李小康将自己的程序推广到学院,让学院学生管理者试用,同样,效率惊人,几无差错。
 
目前,他的程序已在该学院使用了2周。

 

原理并不复杂


识别核酸检测截图,对应计算机术语叫OCR技术,即Optical Character Recognition,光学字符识别。
 
而作为一名生物医学工程专业的博士生,他的研究方向是医学影像与人工智能,他平常会接触很多图像处理方法。
 
因此,在李小康看来,这一点也不复杂。
 
李小康说:「OCR可以把图像中的文字识别出来,转换为文本信息,便于核查,而且核酸截图是打印字体,识别率非常高,几乎可以做到100%准确」。
 
一张核酸截图的文本信息包括姓名、证件类型、证件号码、样本编号、采样时间、检测机构、检测时间、检测项目、检测结果等。
 
为此,他的基本方法是:OCR文字识别+正则表达式筛选。
 
所谓正则表达式,即可以搜索到字符串中的特定模式内容。「把想要的信息从识别的文本中筛选出来,确认好每张图的信息,再把结果输出到Excel,方便人工确认。」李小康说。
 
 
预计在不久的将来,师生们可不用通过微信手动收集核酸截图,而是通过小程序直接上传图片,二级单位负责人可在后台随时查看统计结果。
 
李小康认为,只是尽自己能力帮助大家,希望所有复旦人都能同心协力,传承发扬团结、服务、牺牲的精神,这场战「疫」一定可以胜利。
 
消息一出,网友纷纷点赞:
 
有网友惊呼「太牛了」,「李导优秀」,「不愧是复旦」!
 
也有网友评论到:「这就是知识的魅力吧」,「就是觉得很棒,科研用于实践」!
 
 
还有网友认为,这种知行合一的精神值得提倡,[学以致用,干得漂亮」,「这就是博士」!
 



参考资料:
https://www.fudan.edu.cn/_s3/2022/0407/c5a130819/page.psp



登录查看更多
0

相关内容

代码(Code)是专知网的一个重要知识资料文档板块,旨在整理收录论文源代码、复现代码,经典工程代码等,便于用户查阅下载使用。
专知会员服务
48+阅读 · 2021年7月14日
专知会员服务
65+阅读 · 2021年7月4日
【经典书】机器学习导论,234页pdf
专知会员服务
74+阅读 · 2021年4月20日
专知会员服务
56+阅读 · 2021年4月12日
【经典书】《学习OpenCV 3》,1018页pdf
专知会员服务
130+阅读 · 2021年2月28日
上海团长图鉴
创业邦杂志
0+阅读 · 2022年4月14日
大龄读博那几年,与君共勉
极市平台
0+阅读 · 2022年2月19日
清华大学两名博士生被开除:你不吃学习的苦,就要吃生活的苦
机器学习算法与Python学习
25+阅读 · 2019年9月16日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
12+阅读 · 2022年4月12日
VIP会员
相关VIP内容
专知会员服务
48+阅读 · 2021年7月14日
专知会员服务
65+阅读 · 2021年7月4日
【经典书】机器学习导论,234页pdf
专知会员服务
74+阅读 · 2021年4月20日
专知会员服务
56+阅读 · 2021年4月12日
【经典书】《学习OpenCV 3》,1018页pdf
专知会员服务
130+阅读 · 2021年2月28日
相关基金
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员