With the emergence of service robots and surveillance cameras, dynamic face recognition (DFR) in wild has received much attention in recent years. Face detection and head pose estimation are two important steps for DFR. Very often, the pose is estimated after the face detection. However, such sequential computations lead to higher latency. In this paper, we propose a low latency and lightweight network for simultaneous face detection, landmark localization and head pose estimation. Inspired by the observation that it is more challenging to locate the facial landmarks for faces with large angles, a pose loss is proposed to constrain the learning. Moreover, we also propose an uncertainty multi-task loss to learn the weights of individual tasks automatically. Another challenge is that robots often use low computational units like ARM based computing core and we often need to use lightweight networks instead of the heavy ones, which lead to performance drop especially for small and hard faces. In this paper, we propose online feedback sampling to augment the training samples across different scales, which increases the diversity of training data automatically. Through validation in commonly used WIDER FACE, AFLW and AFLW2000 datasets, the results show that the proposed method achieves the state-of-the-art performance in low computational resources. The code and data will be available at https://github.com/lyp-deeplearning/MOS-Multi-Task-Face-Detect.


翻译:随着服务机器人和监视摄像机的出现,野生的动态面部识别(DFR)近年来受到极大关注。脸部检测和头部估计是DFR的两个重要步骤。通常,在面部检测后,对面部显示的构成进行估计。但是,这种顺序计算导致较高的悬浮度。在本文中,我们提议建立一个低潜值和轻量网络,用于同时进行面部检测、标志性局部化和头部估计。在观察的启发下,用大角度定位面部的面部标志更具挑战性,因此建议进行损失,以限制学习。此外,我们还提议进行不确定的多任务损失,以自动了解各项任务的重量。另一个挑战是,机器人经常使用低计算单位,如以ARM为基础的计算核心,而我们往往需要使用轻量网络,而不是重的网络,从而导致性能下降,特别是小脸部和硬脸部。我们提议进行在线反馈抽样,以增加不同尺度的培训样本,从而自动增加培训数据的多样性。通过在常用 WIDER FACE、AFLW-W-AFLW-FAL-WT-FADMT/FALMT)2000年/FAL-FARBS 数据库中的拟议数据计算结果将显示州数据计算结果。在数据库中,将自动显示国家业绩结果显示。

0
下载
关闭预览

相关内容

CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
NIPS 2017:贝叶斯深度学习与深度贝叶斯学习(讲义+视频)
机器学习研究会
36+阅读 · 2017年12月10日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
【推荐】GAN架构入门综述(资源汇总)
机器学习研究会
10+阅读 · 2017年9月3日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
5+阅读 · 2019年2月28日
Arxiv
5+阅读 · 2018年10月4日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
7+阅读 · 2017年12月26日
VIP会员
Top
微信扫码咨询专知VIP会员