冠军方案解读|世界人工智能创新大赛-口罩识别方向

2020 年 7 月 5 日 极市平台

加入极市专业CV交流群,与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度 等名校名企视觉开发者互动交流!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。关注 极市平台 公众号 ,回复 加群,立刻申请入群~


2020年世界人工智能创新大赛菁英挑战赛已经圆满落幕,获奖名单已于前日公布,我们邀请到了口罩识别赛题的冠军来做竞赛方案解读。

首先感谢比赛方举办这个比赛,Openvino在CPU上的加速效果很明显,非常适合CPU环境下的算法部署,通过这个比赛熟练掌握了Openvino封装部署,算是比赛的一大收获。也感谢极市工作人员邀请,以下分享我的解决方案。代码:https://github.com/whoNamedCody/Mask-Face-Detection

赛题数据:

赛题大部分数据是监控场景数据,大部分人脸都比较小,姿态较大。

任务描述:

检测图片中戴口罩和未带口罩的人脸,面向实际工程项目落地,需要在F1-score和FPS之间trade-off。

模型选择:

考虑到大部分人脸比较小,又有速度要求,因此选择CenterNet(Objects as Points)结构,CenterNet基于高斯点的方式,对小目标天生友好。因为原始的CenterNet需要训练周期比较长,因此选择了TTFNet(Training-Time-Friendly Network for Real-Time Object Detection)结构。

(1)CenterNet 论文:https://arxiv.org/pdf/1904.07850 代码:https://github.com/xingyizhou/CenterNet

CenterNet使用中心点表示目标,中心点定位损失函数使用Focal loss;直接回归目标的宽高WH,因为量化误差,还回归了中心点的Offset,回归使用L1 loss;不需要预设Anchor,也不需要NMS(使用3x3的MaxPooling)。

(2)TTFNet 论文:https://arxiv.org/pdf/1909.00700 代码:https://github.com/ZJULearning/ttfnet

CenterNet的WH回归只有中心点一个正样本,仅关注目标中心,会导致网络收敛速度慢,加重对复杂数据增强的依赖性,因此提出高斯采样,将中心点附近的进行密集的高斯采样,作为边框回归的样本,并进行高斯加权。中心点定位和CenterNet一样,使用Focal loss;回归是回归到边框的4个距离(left,top,right,bottom,这样就包含了Offset),损失函数使用Giou loss。

(3)ASFF 论文:https://arxiv.org/pdf/1911.09516 代码:https://github.com/ruinmessi/ASFF

为了充分利用不同尺度的特征,ASFF提出一种新的特征融合方式,在网络结构中自适应调整不同层的权重。原始的ASFF是三层FPN融合,后面我融合了四层。

(4)SSH 论文:https://arxiv.org/pdf/1708.03979

使用类似SSH模块的Context Module(下图来自Retinaface,也是后面讲的SSH模块),增加感受野以及增强语义建模能力。

设计的网络结构:

骨干网使用mobilenetv2(0.5),将relu6替换为relu,使用ASFF融合不同层特征,SSH增强感受野和语义建模能力。最后模型大小大概2 Mb。

分类分支定位人脸中心点,并对人脸进行分类(mask和nomask),损失函数采用Focal loss;回归分支回归人脸中心点到边框的距离(left,top,right,bottom),损失函数采用Giou loss;优化器使用Adam,采用Step学习率。测试时使用Softnms,使用MaxPooling速度快点,但精度会差一点。(最后800x640的输入F1-score是0.76,速度大概是十几帧,由于C++测速bug,这个模型只训练一次就没有优化,最后降低输入分辨率到576x384, 将速度提到32 FPS,F1-score是0.69,因此除上述提到的外未使用其他训练trick,模型精度应该还可以提升)。

关于Openvino封装:

封装的一个比较重要的点是理解Openvino推理后的数据存储顺序,比如我的网络结构检测一张图片输出是1HW2和1HW4,使用Openvino推理的输出是可以理解为两个一维数组,长度是HW2和HW4。如下heatmap就是中心点定位的输出,x和y分别是两个类别的预测分数。其他细节见github。


推荐阅读



添加极市小助手微信(ID : cv-mart),备注:研究方向-姓名-学校/公司-城市(如:目标检测-小极-北大-深圳),即可申请加入极市技术交流群,更有每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、行业技术交流一起来让思想之光照的更远吧~


△长按添加极市小助手


△长按关注极市平台,获取最新CV干货


觉得有用麻烦给个在看啦~  

登录查看更多
1

相关内容

CenterNet由中科院,牛津大学以及华为诺亚方舟实验室联合提出,截至目前,CenterNet应该是one-stage目标检测方法中性能最好的方法。
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
84+阅读 · 2020年6月9日
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
ICCV 2019轻量级人脸识别挑战赛三冠军技术方案
极市平台
5+阅读 · 2019年12月1日
工业视觉中的目标检测——兼谈天池大赛优胜方案
旷视COCO2018 Keypoint冠军算法详解
极市平台
5+阅读 · 2019年1月10日
ECCV 2018 | OR-CNN行人检测:为‘遮挡’而生
极市平台
6+阅读 · 2018年9月21日
搜狐图文匹配算法大赛_方案分享
数据挖掘入门与实战
7+阅读 · 2018年2月23日
深度学习CTPN算法的解读与tensorflow实现
北京思腾合力科技有限公司
9+阅读 · 2017年12月1日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
8+阅读 · 2018年5月17日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
7+阅读 · 2018年1月24日
VIP会员
相关资讯
ICCV 2019轻量级人脸识别挑战赛三冠军技术方案
极市平台
5+阅读 · 2019年12月1日
工业视觉中的目标检测——兼谈天池大赛优胜方案
旷视COCO2018 Keypoint冠军算法详解
极市平台
5+阅读 · 2019年1月10日
ECCV 2018 | OR-CNN行人检测:为‘遮挡’而生
极市平台
6+阅读 · 2018年9月21日
搜狐图文匹配算法大赛_方案分享
数据挖掘入门与实战
7+阅读 · 2018年2月23日
深度学习CTPN算法的解读与tensorflow实现
北京思腾合力科技有限公司
9+阅读 · 2017年12月1日
相关论文
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
8+阅读 · 2018年5月17日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
7+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员