复旦博士生写了130行代码,用OCR和正则表达式快速搞定核酸报告统计!

2022 年 4 月 9 日 CVer

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

金磊 发自 凹非寺
转载自:量子位(QbitAI)

2分钟,“啪的一下”。

800多人的核酸完成截图就审核完毕了。

这就是一位复旦大学生物医学工程专业博士生,在最近共同抗疫期间开发的一项小程序发挥的作用。

而且仅仅是花费1小时130行代码的那种。

复旦大学官方对这个“抗疫利器”的评价是:

大大提高了核酸核查的效率和精度。

这位博士生的工作,也引来网友们的“膜拜”:

人民日报也对他的工作做出了评价,认为这波“操作火了”

2分钟搞定1小时工作

整件事的起因,是最近抗疫期间,复旦大学启动了常态化核酸筛查工作。

“痛点”也随之而来。

也就是要核查每位学生“健康云”核酸完成截图,需要花费大量的时间和人力。

但总的来说,这其实是一项重复性较高、单调且枯燥的工作:

一个班级的截图可能就需要花上半小时核查,如果是人数多的院系可能需要更久,还可能会看错看漏。

而复旦的这位博士生,身为学院2019级信息1班辅导员,在此期间负责的正是这项工作。

于是,他便心生一计——“搞个OCR识别代码

图源:复旦大学

最初与学工同事分享这个想法的时候,同事还担心会不会太难了。

而他却回复说:

有现成的库,import一下就好了。

然后,1个小时过去了……

“我写好了”。

同事见状甚至感慨说“这就是博士吗”

于是乎,他的代码程序就开始在自己的班级中“上岗”了。

图源:复旦大学

在进行验证之后,这段程序的准确率还是很高的,甚至还发现了此前人工核查时没有发现的问题。

最重要的是,这项工作的速度有了大幅的提高。

例如原先要核查800张截图,几个工作人员要花费1个多小时,而现在,2分钟即可拿到结果!

至于原理,这位博士生谦虚地说“并不复杂”。

他所用到的技术主要是OCR (光学字符识别),代码语言则是Python

图源:复旦大学

根据复旦官方的介绍,这位博士生更具体的是用到了Python中的正则表达式

正则表达式可以把想要的信息从OCR识别的文本中筛选出来。

最后还会汇总到一张Excel文件中,方便工作人员确认。

而且为了他为了方便不会编程的同事使用,还把程序进行了封装,只需要输入一行命令就可以使用了。

来自复旦大学的博士生

开发这项“抗疫利器”的博士生,是来自复旦大学的李小康

有意思的是,他并非是计算机专业的学生,而是生物医学工程专业

其研究方向是医学影像与人工智能。

图源:复旦大学

对于这项工作,他认为:

虽然原理也很简单,只要是会写代码的人第一时间就会明白是怎么回事,但是不做相关工作的感受不到这件事情的费时费力,自然也不会想出办法。

我只是用我学到的知识解决实际工作中的困难。

图源:复旦大学,李小康本人留言

据复旦大学官方介绍,在不久之后,师生可以不再手动收集核酸截图,而是通过小程序直接上传图片了。

……

最后,引用李小康本人的话:

这场战“疫”我们一定可以胜利!

参考链接:

[1]https://mp.weixin.qq.com/s/RogQcUAsZszW5HkYwYcV-w
[2]https://mp.weixin.qq.com/s/l8u9JifKDlRDoz32-jZWQg
[3]https://weibo.com/1726918143/Lnn2Ll7KZ?type=comment#_rnd1649380649145

ICCV和CVPR 2021论文和代码下载


后台回复:CVPR2021,即可下载CVPR 2021论文和代码开源的论文合集

后台回复:ICCV2021,即可下载ICCV 2021论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF


目标检测和Transformer交流群成立


扫描下方二维码,或者添加微信:CVer6666,即可添加CVer小助手微信,便可申请加入CVer-Transformer或者目标检测 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。


一定要备注:研究方向+地点+学校/公司+昵称(如Transformer或者目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信: CVer6666,进交流群


CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!


扫码进群

▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

登录查看更多
1

相关内容

代码(Code)是专知网的一个重要知识资料文档板块,旨在整理收录论文源代码、复现代码,经典工程代码等,便于用户查阅下载使用。
斯坦福大学NLU公开课CS224U来了,视频代码PPT都有
专知会员服务
33+阅读 · 2022年4月11日
【干货书】概率,统计与数据,513页pdf
专知会员服务
130+阅读 · 2021年11月27日
【干货书】《Pydon'ts:编写优雅的Python代码》,263页pdf
专知会员服务
91+阅读 · 2021年11月2日
【干货书】利用 Python 进行数据分析,470页pdf
专知会员服务
109+阅读 · 2021年3月13日
【干货书】数据科学家统计实战,附代码与409页pdf
专知会员服务
59+阅读 · 2020年11月6日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
6000字,快速理解低代码
人人都是产品经理
2+阅读 · 2022年1月3日
OCR自训练平台的天花板!它来了…
CVer
0+阅读 · 2021年12月17日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月17日
VIP会员
相关VIP内容
斯坦福大学NLU公开课CS224U来了,视频代码PPT都有
专知会员服务
33+阅读 · 2022年4月11日
【干货书】概率,统计与数据,513页pdf
专知会员服务
130+阅读 · 2021年11月27日
【干货书】《Pydon'ts:编写优雅的Python代码》,263页pdf
专知会员服务
91+阅读 · 2021年11月2日
【干货书】利用 Python 进行数据分析,470页pdf
专知会员服务
109+阅读 · 2021年3月13日
【干货书】数据科学家统计实战,附代码与409页pdf
专知会员服务
59+阅读 · 2020年11月6日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员