TinaFace:人脸检测新纪录

2020 年 12 月 6 日 计算机视觉life

点击上方“计算机视觉life”,选择“星标”

快速获得最新干货

本文转自极市平台

作者丨mileistone@知乎
来源丨https://zhuanlan.zhihu.com/p/315511581
编辑丨极市平台

导读

 

作者设计了一个简易人脸检测模型TinaFace,该模型基于RetinaNet,相比RetinaNet只做了很小的改动。文章展示了该模型在单模型backbone仅为ResNet50的情况下的数据结果,都达到了当前的state of the art,文章附有该模型代码的开源地址。

这几年人脸检测的benchmark越刷越高,方法也越来越复杂,提出的模块或者方法大都专门为人脸检测设计,不易复现和使用,比如DSFD里的FEM、PAL、IAM,ASFD里的AutoFEM、PAL、IAM、DRMC loss,HAMBox里的PA、OAM、RAL等等。

WIDER FACE验证集hard结果

WIDER FACE测试集hard结果

鉴于此,我们设计了一个简单而又强大的人脸检测模型——TinaFace(https://github.com/Media-Smart/vedadet/tree/main/configs/trainval/tinaface),该模型基于RetinaNet,相比RetinaNet只做了很小的改动:

  • 将BN换成GN;
  • 加了一个IoU预测分支;
  • 在backbone上嵌入了DCNv1;
  • 将框回归的loss从smooth l1 loss替换为DIoU loss。

在仅使用ResNet50作为backbone的情况下,TinaFace在WIDER FACE的验证集和测试集中的hard上达到了当前的state of the art。我们只看hard的原因在于WIDER FACE的easy和medium都包含在hard之中,hard体现的是一个人脸检测器在所有人脸上的检测效果。

具体来说,在单模型,backbone仅为ResNet50的情况下。

1、验证集上

1.1、不使用TTA的TinaFace:TinaFace的AP为93.0%,比基于ResNet152的ASFD(使用TTA)高0.5%,比基于ResNet152的DSFD(使用TTA)高1.8%

1.2、使用TTA的TinaFace:TinaFace的AP为93.4%,比基于ResNet50的HAMBox(使用TTA)高0.1%

2、测试集上

2.1、不使用TTA的TinaFace:TinaFace的AP为92.1%,与基于ResNet152的ASFD(使用TTA)一样,比基于ResNet152的DSFD(使用TTA)高2.1%

2.2、使用TTA的TinaFace:TinaFace的AP为92.4%,比基于ResNet50的HAMBox(使用TTA)高0.1%

TinaFace非常简单,基于RetinaNet,所添加的模块在在通用的目标检测框架(比如mmdetection、vedadethttps://github.com/Media-Smart/vedadet))中都是现成的。而且训练不需要大batch,即使你的显存只有11G,也可以复现TinaFace。也正因为TinaFace使用的模块都非常经典、成熟,TinaFace也会比较容易部署。

我们的代码开源地址为TinaFace,基于vedadet,里面提供当前最好结果的权重,以及训练、测试、推理代码,无论大家是想做研究、打比赛、还是仅仅想体验state of the art的效果,这个repo都能满足你。

vedadet能做到的不仅于此,vedadet是我们基于mmdetection开发的单阶段目标检测框架,适用任意目标检测任务,无论是人脸检测还是通用目标检测。vedadet提供训练、测试、推理特性,后续会支持转ONNX/TensorRThttps://github.com/Media-Smart/volksdep),以及基于TensorRT的Python前端SDKhttps://github.com/Media-Smart/flexinfer)或者C++前端SDKhttps://github.com/Media-Smart/cheetahinfer)。

想了解实验细节的朋友可以参见论文TinaFace: Strong but Simple Baseline for Face Detection(https://arxiv.org/abs/2011.13183)。实验中使用的数据分析工具我们也开源了——volkscv(https://github.com/Media-Smart/volkscv)。


专辑:计算机视觉方向简介

专辑:视觉SLAM入门

专辑:最新SLAM/三维视觉论文/开源

专辑:三维视觉/SLAM公开课

专辑:深度相机原理及应用

专辑:手机双摄头技术解析与应用

专辑:相机标定

专辑:全景相机

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

投稿、合作也欢迎联系:simiter@126.com

扫描关注视频号,看最新技术落地及开源方案视频秀 ↓


登录查看更多
3

相关内容

人脸检测(Face Detection)是一种在任意数字图像中找到人脸的位置和大小的计算机技术。它可以检测出面部特征,并忽略诸如建筑物、树木和身体等其他任何东西。有时候,人脸检测也负责找到面部的细微特征,如眼睛、鼻子、嘴巴等的精细位置。
【AAAI2021-斯坦福】身份感知的图神经网络
专知会员服务
38+阅读 · 2021年1月27日
【Google】梯度下降,48页ppt
专知会员服务
80+阅读 · 2020年12月5日
【ACMMM2020】小规模行人检测的自模拟学习
专知会员服务
14+阅读 · 2020年9月25日
专知会员服务
12+阅读 · 2020年9月19日
一份简单《图神经网络》教程,28页ppt
专知会员服务
123+阅读 · 2020年8月2日
【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack
专知会员服务
44+阅读 · 2020年4月10日
【Google-CMU】元伪标签的元学习,Meta Pseudo Labels
专知会员服务
31+阅读 · 2020年3月30日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
目前最强性能的人脸检测算法(Wider Face Dataset)
计算机视觉战队
5+阅读 · 2019年9月4日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
FaceBoxes—官方开源CPU实时高精度人脸检测器
极市平台
11+阅读 · 2019年1月18日
中国团以98%精度夺得MegaFace人脸识别冠军(开源)
全球人工智能
5+阅读 · 2018年3月12日
人脸表情分类与识别:人脸检测+情绪分类
北京思腾合力科技有限公司
27+阅读 · 2017年12月18日
keras实战︱人脸表情分类与识别:人脸检测+情绪分类
数据挖掘入门与实战
21+阅读 · 2017年12月16日
咦,用浏览器做人脸检测,竟然这么简单?
机械鸡
4+阅读 · 2017年9月11日
A GeoSPARQL Compliance Benchmark
Arxiv
0+阅读 · 2021年2月11日
Arxiv
4+阅读 · 2018年12月20日
Arxiv
6+阅读 · 2018年2月6日
VIP会员
相关VIP内容
【AAAI2021-斯坦福】身份感知的图神经网络
专知会员服务
38+阅读 · 2021年1月27日
【Google】梯度下降,48页ppt
专知会员服务
80+阅读 · 2020年12月5日
【ACMMM2020】小规模行人检测的自模拟学习
专知会员服务
14+阅读 · 2020年9月25日
专知会员服务
12+阅读 · 2020年9月19日
一份简单《图神经网络》教程,28页ppt
专知会员服务
123+阅读 · 2020年8月2日
【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack
专知会员服务
44+阅读 · 2020年4月10日
【Google-CMU】元伪标签的元学习,Meta Pseudo Labels
专知会员服务
31+阅读 · 2020年3月30日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
相关资讯
目前最强性能的人脸检测算法(Wider Face Dataset)
计算机视觉战队
5+阅读 · 2019年9月4日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
FaceBoxes—官方开源CPU实时高精度人脸检测器
极市平台
11+阅读 · 2019年1月18日
中国团以98%精度夺得MegaFace人脸识别冠军(开源)
全球人工智能
5+阅读 · 2018年3月12日
人脸表情分类与识别:人脸检测+情绪分类
北京思腾合力科技有限公司
27+阅读 · 2017年12月18日
keras实战︱人脸表情分类与识别:人脸检测+情绪分类
数据挖掘入门与实战
21+阅读 · 2017年12月16日
咦,用浏览器做人脸检测,竟然这么简单?
机械鸡
4+阅读 · 2017年9月11日
Top
微信扫码咨询专知VIP会员