人脸识别 | 基于深度学习以人类为中心的图像理解

会员服务 ·

人脸识别 | 基于深度学习以人类为中心的图像理解

2019 年 3 月 17 日 计算机视觉战队

春天来了

小草偷偷地从土里钻出来，嫩嫩的，绿绿的。园子里，田野里，瞧去，一大片一大片满是的。坐着，躺着，打两个滚，踢几脚球，赛几趟跑，捉几回迷藏。

是不是突然觉得这不是人工智能的平台吧！

啊哈哈哈~今天杭州的天气格外的好，有一种想去西湖游荡一圈的冲动，有一种上灵隐寺烧香拜佛的想法，有一种骑行环绕西湖景区的动机，但是~最后还是被好的Paper、好的程序、好的框架给吸引，在笔记本前敲击着键盘，为大家带来今天的分享，想和大家一起学习。

今天和大家说的是关于人脸识别及人类部件解析。下面先给大家展示下具体背景及效果图，然后我们开始展开讲解。

视频展示

这里主要就是展示了人脸检测识别，并且会提示你有没有恶意遮挡，才可以进行检查。

本次讲解的人脸主要有一下三种因素影响：

UnconstrainedFaceRecognition

Large-ScaleFaceRecognition

Low-ShotLearning

在现实生活中，可以通过很多路径产生图像，比如以上的所有设备，都可以迅速以及实时的采集图像，所以现实中图像数据最为常见，所以针对人脸识别有一个比较好的优势，就是可以通过一些设备进行监查，时刻在手机数据样本，增加设计框架的泛化性能。

今天主要讲解的框架如下:

那我们先说说Face Recognition！根据最近几年的框架开始展开讲解：

3D-Aided Dual-Agent GANs forUnconstrained Face Recognition

主要提出一种Dual-Agent生成对抗网络(DA-GaN)模型，该模型能够提高真实人脸仿真器输出的真实感，同时在真实感细化过程中保留身份信息。Dual-Agent是专为区分真伪和身份而设计的。特别是使用现成的三维人脸模型作为模拟器来生成不同姿态的轮廓人脸图像，Da-GAN利用FCN作为发生器，利用自动编码器作为Dual-Agent的判别器，除了新的结构外，还对标准GAN进行了几个关键的修改，以保持姿态和纹理，保持身份和稳定训练过程：(1)姿态感知损失；(2)身份感知损失；(3)具有边界平衡正则项的对抗性损失。此外，所提出的DA-GAN也是一种更有效地解决通用迁移学习问题的新方法。

Keywords: UnconstrainedFaceRecognition;FaceSynthesis;3DFaceModel;GenerativeAdversarial Networks

Towards Pose Invariant FaceRecognition in the Wild

在人脸识别中，影响准确率的一个比较重要的因素是姿态的多样性。放眼目前的人脸识别技术，有两种方法为主流方向，一种是直接提取不同姿态的人脸特征，另一种就是再提取特征之前，现将人脸摆正。

本文方法可以将两种方法联合起来使用，最终二者相互影响，实现准确率的提升。提出了一种Pose Invariant Model (PIM)的方法来识别自然场景的人脸。

本方法有三个新颖之处：

1、PIM是一个新奇统一的深度框架包括了人脸摆正（Face Frontalization sub-Net, FFN）和一个特征学习(Discriminative Learning sub-NetDLN）；

2、FFN是一个设计好的双通道的GAN网络来同时感知全局和局部的细节；

3、DLN是一个人脸识别的中通用的CNN，利用enforced交叉熵来优化网络。

Keywords

Pose-InvariantFaceRecognition

Cross-DomainAdversarialLearning; DomainAdaption

TransferLearning

LearningtoLearn

DynamicConvolution

EnforcedCross-Entropy Optimization

Generative Adversarial Networks

之后的几项我们会在”计算机视觉协会“知识星球为大家带来详细讲解，并给予详细的代码，希望有兴趣的同学可以进一步学习！

Human Parsing

主要用一下案例讲解：

Winner:CVPR2017 LIP Human ParsingChallenge

提出了一种用于人体解析的自监督神经聚合网络(SSNAN)。SSNAN自适应地学习在每个像素“address”上聚合多尺度特征。为了进一步提高特征识别能力，在不需要额外监督的情况下，采用自监督的联合损失作为辅助学习策略，将人的联合结构引入到分析结果中。提出的SSNAN是端到端可训练的，SSNAN可以集成到任何先进的神经网络中，以帮助在不同的位置和尺度上聚集关于重要性的特征，并从全局的角度整合关于人类关节结构的丰富的高级知识，从而提高解析结果。

最后再说说这个领域的未来工作吧！（点击阅读原文，可以获取部分代码！）

Face

验证和识别：无约束(如姿态、年龄、化妆、表情、模糊等)/大规模/低命中人脸识别
视频监视、安全场景(例如，防、活性检测等)、Mobile、人机交互分析与多人分析：自上而下、多任务学习方法OE-商业、群体行为分析、人-再识别、图像编辑、视频监控、自主驾驶、虚拟现实

Human

人类分析和多人分析：自上而下和自下而上，多任务学习方法
E-Commercial，群体行为分析，行人-再识别，图像编辑，视频监视，自主驾驶，虚拟现实

如果想加入我们“计算机视觉战队”，请扫二维码加入学习群。计算机视觉战队主要涉及机器学习、深度学习等领域，由来自于各校的硕博研究生组成的团队，主要致力于人脸检测、人脸识别，多目标检测、目标跟踪、图像分割等研究方向。

登录查看更多

相关内容

Cognition

关注 4

Cognition：Cognition：International Journal of Cognitive Science Explanation：认知：国际认知科学杂志。 Publisher：Elsevier。 SIT： http://www.journals.elsevier.com/cognition/

最新《深度学习自动驾驶》技术综述论文，28页pdf

专知会员服务

155+阅读 · 2020年6月14日

基于小样本学习的图像分类技术综述

专知会员服务

151+阅读 · 2020年5月6日

【天津大学】风格线条画生成技术综述

专知会员服务

34+阅读 · 2020年4月26日

【CVPR2020】多模态社会媒体中危机事件分类

专知会员服务

55+阅读 · 2020年4月18日