人脸识别研究取得进展

2019 年 3 月 26 日 中科院之声

近些年得益于网络架构、训练策略以及人脸数据的发展,人脸识别技术取得了巨大的提升,越来越多地被推广到安防领域,延伸出考勤机、门禁机等多种产品,产品系列达20多种类型,可以全面覆盖煤矿、楼宇、银行、军队、社会福利保障、电子商务及安全防务等领域,人脸识别的全面应用时代已经到来。

  

然而,现有方法主要关注自然环境下的人脸识别,其训练数据大都从网络上收集而来,一般只包含中等量级的人数(约10万人),但每类平均样本数很多(多于20个)。然而,实际应用中的人脸识别系统通常只能获取2张图像,一张证件照,一张现场照。同时,系统需要面对的人脸个体数量可达到上百万甚至是千万级。因此,实际中人脸数据库通常具有海量类别,但每类只有2个样本,一般被称之为大规模双样本问题。

  

现有方法在训练这种数据时会遇到巨大的挑战,例如类内变化不足使得训练难以收敛以及海量样本数对计算设备的极端要求。为此,中国科学院自动化研究所针对真实场景下的人证核验问题,提出了基于深度学习的大规模双样本学习方法,解决了双样本数据带来的类内变化不足问题和海量样本数计算压力大的问题。

  

目前,深度学习在人脸识别界具有统治地位,基于分类的训练方法是主流,其将每个人当作独立的类别,并使用softmax进行分类训练。近两年SphereFace,CosFace以及InsightFace进一步引入了边界裕量(margin)来提高识别网络的可扩展性,在公开测试集上取得了领先性能。然而,softmax的计算消耗与类别数直接相关。在实际应用中,百万类甚至千万类的分类会对训练平台产生极大压力,普通训练平台(如8卡TITANX)甚至无法训练,给主流方法的应用带来了困难。

  

自动化所朱翔昱、雷震等研究人员提出的大规模双样本学习方法包括两个方面,一是提出了一种分类-验证-分类(CVC)的训练策略来逐步提高实际场景中的性能,二是针对大规模分类问题提出了DP-softmax使得深度学习在超大规模类别的分类上具有可扩展性。

  

在分类-验证-分类(CVC)训练策略中,研究人员将整个训练过程分为三个阶段。第一个阶段为Pre-learning(Classification),首先在网图人脸数据库上训练一个深度神经网络模型,以得到一个较好的初始人脸识别性能。第二阶段为Transfer Learning (Verification),使用基于度量学习的人脸验证方法如triplet loss在大规模双样本数据上进行微调,将人脸知识从自然环境迁移到人证场景下。第三阶段为Fine-grained Learning (Classification),构建了一个特殊的分类层DP-softmax对百万级类别进行分类,最终达到人证场景下的最优性能。

  

DP-softmax极大降低了大规模分类的计算需求,首先通过CVC策略中第二阶段的模型对训练数据抽取特征并构建每个类别的类别模板(prototype),生成所有类别的类别模板库。在训练过程中,针对当前mini-batch中的样本选择与他们最相似的少量类别模板构建临时分类层来完成本次分类训练。整个过程可以在不影响训练效果的前提下,极大降低大规模分类的计算需求。研究人员对提出的方法进行了充分的实验,表明在IvS场景下,该方法相比现有方法有了明显提升。

   

相关研究成果发表于International Journal of Computer Vision


来源:中国科学院自动化研究所


温馨提示:近期,微信公众号信息流改版。每个用户可以设置 常读订阅号,这些订阅号将以大卡片的形式展示。因此,如果不想错过“中科院之声”的文章,你一定要进行以下操作:进入“中科院之声”公众号 → 点击右上角的 ··· 菜单 → 选择「设为星标」






登录查看更多
4

相关内容

人脸识别,特指利用分析比较人脸视觉特征信息进行身份鉴别的计算机技术。广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。生物特征识别技术所研究的生物特征包括脸、指纹、手掌纹、虹膜、视网膜、声音(语音)、体形、个人习惯(例如敲击键盘的力度和频率、签字)等...
社区检测的深度学习:进展、挑战和机遇
专知会员服务
47+阅读 · 2020年7月9日
基于深度学习的多标签生成研究进展
专知会员服务
143+阅读 · 2020年4月25日
【北航】面向自然语言处理的预训练技术研究综述
专知会员服务
113+阅读 · 2020年4月23日
图神经网络表达能力的研究综述,41页pdf
专知会员服务
170+阅读 · 2020年3月10日
专知会员服务
201+阅读 · 2020年3月6日
零样本图像分类综述 : 十年进展
专知会员服务
128+阅读 · 2019年11月16日
【上海交大】半监督学习理论及其研究进展概述
专知会员服务
71+阅读 · 2019年10月18日
【综述】智能医疗综述,48页论文详述医学AI最新进展
专知会员服务
71+阅读 · 2019年9月1日
【紫冬新作】人脸识别新突破:真实场景下的大规模双样本学习方法
中国科学院自动化研究所
11+阅读 · 2019年3月7日
生成对抗网络研究人脸识别领域获进展
中科院之声
8+阅读 · 2018年9月24日
从人脸识别到行人重识别,下一个风口
计算机视觉战队
13+阅读 · 2017年11月24日
人脸检测与识别年度进展概述
深度学习大讲堂
5+阅读 · 2017年6月26日
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
Arxiv
4+阅读 · 2018年12月20日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
6+阅读 · 2018年6月21日
VIP会员
相关VIP内容
社区检测的深度学习:进展、挑战和机遇
专知会员服务
47+阅读 · 2020年7月9日
基于深度学习的多标签生成研究进展
专知会员服务
143+阅读 · 2020年4月25日
【北航】面向自然语言处理的预训练技术研究综述
专知会员服务
113+阅读 · 2020年4月23日
图神经网络表达能力的研究综述,41页pdf
专知会员服务
170+阅读 · 2020年3月10日
专知会员服务
201+阅读 · 2020年3月6日
零样本图像分类综述 : 十年进展
专知会员服务
128+阅读 · 2019年11月16日
【上海交大】半监督学习理论及其研究进展概述
专知会员服务
71+阅读 · 2019年10月18日
【综述】智能医疗综述,48页论文详述医学AI最新进展
专知会员服务
71+阅读 · 2019年9月1日
相关资讯
【紫冬新作】人脸识别新突破:真实场景下的大规模双样本学习方法
中国科学院自动化研究所
11+阅读 · 2019年3月7日
生成对抗网络研究人脸识别领域获进展
中科院之声
8+阅读 · 2018年9月24日
从人脸识别到行人重识别,下一个风口
计算机视觉战队
13+阅读 · 2017年11月24日
人脸检测与识别年度进展概述
深度学习大讲堂
5+阅读 · 2017年6月26日
相关论文
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
Arxiv
4+阅读 · 2018年12月20日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
6+阅读 · 2018年6月21日
Top
微信扫码咨询专知VIP会员