视频人脸识别进展综述

2021 年 3 月 12 日 专知


摘要: 人脸识别是生物特征识别领域的一项关键技术,长期以来得到研究者的广泛关注。视频人脸识别任务特指从一段视频中提取出人脸的关键信息,从而完成身份识别。相较于基于图像的人脸识别任务来说,视频数据中的人脸变化模式更为多样且视频帧之间存在较大差异,如何从冗长而复杂的视频中抽取到人脸的关键特征成为当前的研究重点。以视频人脸识别技术为研究对象,首先介绍了该技术的研究价值和存在的挑战;接着对当前研究工作的发展脉络进行了系统的梳理,依据建模方式将传统基于图像集合建模的方法分为线性子空间建模、仿射子空间建模、非线性流形建模、统计建模四大类,同时对深度学习背景下基于图像融合的方法进行了介绍;另外对现有视频人脸识别数据集进行分类整理并简要介绍了常用的评价指标;最后分别采用灰度特征和深度特征在YTC数据集及IJB-A数据集上对代表性工作进行评测。实验结果表明:神经网络可以从大规模数据中提取到鲁棒的视频帧特征,从而带来识别性能的大幅提升,而有效的视频数据建模能够挖掘出人脸潜在的变化模式,从视频序列包含的大量样本中找到更具判别力的关键信息,排除噪声样本的干扰,因此基于视频的人脸识别具有广泛的通用性和实用价值。

http://www.jsjkx.com/CN/10.11896/jsjkx.210100210


人脸识别是计算机视觉及模式识别领域长期研究的课题 之一.传统的人脸识别主要通过分析两张或多张包含人脸的 图像,并对图像进行脸部关键特征提取来完成身份识别.静 态图像的采集过程中人脸往往是受控的,但在很多实际应用 场景下,需要对非受限拍摄环境下采集的视频进行人脸识别, 如公安部门通过分析监控视频进行嫌疑人排查、互联网公司 对海量视频数据进行以人为核心的分析与管理.因此,视频 人脸识别存在其自身特有的技术难点:1)人脸表观的变化更 加剧烈.除了视频拍摄设备以及摆拍距离较远带来的光照条 件不佳、低分辨率、抖动模糊等多变性外,还包括拍摄对象自身不受控带来的头部姿态多变性、面部表情多变性以及大面 积遮挡的情况.2)需要对视频数据进行整体建模.视频数据 可以看作由多帧图像构成的集合,进行视频人脸识别时,一一 比对两段视频中的所有帧的效率是非常低的,因此往往需要 对视频进行整体建模.然而视频数据长短不一,且图像帧之 间存在较大的差异性,如何从冗长而复杂的视频中提取到人 脸关键信息成为另一大挑战.与此同时,视频数据也具备其 天然的优势:视频数据的多样性提供了更为丰富的人脸信息, 研究者可以通过构造更加复杂的人脸表示来提升人脸识别的 性能[1];另外,视频数据同时具有空间和时间两个维度,可以 提供静态图像不具备的人脸动态信息,从而为人脸识别带来 更多可能性.

完整的视频人脸识别流程主要包括人脸视频数据的采 集、人脸检测、人脸跟踪、人脸特征提取及视频建模等多个环 节,其整体框架图如图1所示.在完成视频数据的收集之后, 首先对视频进行人脸检测及跟踪[2],并对人脸区域进行裁剪, 得到一系列人脸区域图像;人脸特征提取步骤是指对视频中 的每一帧图像采用 PCA 降维[3]、LBP [4]、SIFT [5]、HoG [6]等手 工设计的浅层特征或深度卷积神经网络提取得到人脸关键信 息的特征表达;而视频建模步骤则是利用所有图像特征进行 建模得到统一的人脸特征表示,用于后续的判别分析;最后, 识别任务可以分为1∶1的人脸验证(Verification)任务及1∶N 的人脸辨识(Identification)任务.人脸验证任务主要面向刷 脸进站、刷脸支付等身份核实场景;而人脸辨识主要面向法医 鉴定、门禁系统等身份认证场景.系统中包含一组已知身份 的人脸库(Gallery),在测试阶段会将新的人脸数据(Probe)与 人脸库进行比对,以此来确认身份.如果测试数据身份在人 脸库中出 现 过,则 称 为 闭 集 人 脸 识 别,否 则 称 为 开 集 人 脸 识别. 

近年来,很多研究者采用不同的视频建模方式,充分利用 视频数据的优势尝试应对视频人脸识别任务中的各项挑战. 本文以视频人脸识别技术为研究对象,对该领域的整体发展 脉络进行梳理,并对现有研究方法及常用数据集进行全面而系统的分类介绍,最后通过对比实验分析各方法的独特性,总 结得出未来的研究方向.

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“视频人脸识别” 就可以获取视频人脸识别进展综述》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
59+阅读 · 2021年3月9日
专知会员服务
55+阅读 · 2021年3月5日
专知会员服务
28+阅读 · 2020年12月16日
专知会员服务
67+阅读 · 2020年12月12日
多模态视觉语言表征学习研究综述
专知会员服务
186+阅读 · 2020年12月3日
专知会员服务
37+阅读 · 2020年8月19日
鲁棒模式识别研究进展
专知会员服务
40+阅读 · 2020年8月9日
基于深度学习的手语识别综述
专知会员服务
45+阅读 · 2020年5月18日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
图像修复研究进展综述
专知
16+阅读 · 2021年3月9日
多模态视觉语言表征学习研究综述
专知
25+阅读 · 2020年12月3日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
人脸识别研究取得进展
中科院之声
4+阅读 · 2019年3月26日
万字综述之生成对抗网络(GAN)
PaperWeekly
43+阅读 · 2019年3月19日
人脸关键点检测综述(含论文、数据集、方法等)
AI综述专栏 | 步态识别的深度学习综述
人工智能前沿讲习班
29+阅读 · 2018年6月27日
独家 | 基于深度学习的行人重识别研究综述
AI科技评论
11+阅读 · 2017年12月20日
CNN 模型压缩与加速算法综述
机器学习研究会
16+阅读 · 2017年8月25日
Arxiv
0+阅读 · 2021年6月10日
Generative Adversarial Networks: A Survey and Taxonomy
Deep Face Recognition: A Survey
Arxiv
17+阅读 · 2019年2月12日
VIP会员
相关VIP内容
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
59+阅读 · 2021年3月9日
专知会员服务
55+阅读 · 2021年3月5日
专知会员服务
28+阅读 · 2020年12月16日
专知会员服务
67+阅读 · 2020年12月12日
多模态视觉语言表征学习研究综述
专知会员服务
186+阅读 · 2020年12月3日
专知会员服务
37+阅读 · 2020年8月19日
鲁棒模式识别研究进展
专知会员服务
40+阅读 · 2020年8月9日
基于深度学习的手语识别综述
专知会员服务
45+阅读 · 2020年5月18日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
相关资讯
图像修复研究进展综述
专知
16+阅读 · 2021年3月9日
多模态视觉语言表征学习研究综述
专知
25+阅读 · 2020年12月3日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
人脸识别研究取得进展
中科院之声
4+阅读 · 2019年3月26日
万字综述之生成对抗网络(GAN)
PaperWeekly
43+阅读 · 2019年3月19日
人脸关键点检测综述(含论文、数据集、方法等)
AI综述专栏 | 步态识别的深度学习综述
人工智能前沿讲习班
29+阅读 · 2018年6月27日
独家 | 基于深度学习的行人重识别研究综述
AI科技评论
11+阅读 · 2017年12月20日
CNN 模型压缩与加速算法综述
机器学习研究会
16+阅读 · 2017年8月25日
Top
微信扫码咨询专知VIP会员