之前的《读者也是作者》专栏不知道同学们还记得不,我们特别希望有想法有兴趣的同学来和我们一起分享你们角度对技术的理解。
有效遮挡检测的鲁棒人脸识别
这次主要分享一个比较热门的话题,但是使用的传统方法的人脸检测,并且是在遮挡情况下的人脸检测,希望可以给大家带来一些帮助,谢谢!
文章参考:Efficient Detection of Occlusion prior to Robust Face Recognition
在现实生活中,人脸会有部分遮挡(例如眼镜和围巾)的情况,在这种情况下的遮挡,会给人脸检测带来一定的困扰。所以,有提出一个有效的识别方法,由以下三个部分组成。
遮挡检测部分。首先将给定图像分割为上下两个相等块,进行不同尺度和方向的Gabor小波变换产生特征,使用PCA降维后并用SVM对图像进行分类,判断图像的是否遮挡以及遮挡类型。
遮挡分割。对于第一步检测到的遮挡,利用马尔科夫随机场增强其结构信息,并产生一个二进制掩膜(遮挡像素为1,非遮挡为0)。
提取图像的局部Gabor二进制模型直方图序列(LGBPHS)特征用于人脸识别。对给定图像精确检测遮挡后,对于分遮挡部分提取出LGBPHS特征。
选择Gabor小波变换的原因:因为其具有判别性强和计算性能好的优势。
其中,μ和γ分别表示Gabor核的方向和尺度。
本次选取μ∈[0,7],γ∈[0,4],八个方向四个尺度的Gabor小波变换,其余参数根据经验选择。
因为相位是随时间变化的,所以选择幅度值作为特征矢量。
Ω={Cμγ,μ∈[0,7],γ∈[0,4]},这里的Gabor变换不仅用于遮挡检测而且用于LGBPHS的计算。
基于马尔科夫随机场遮挡分割
从图中可以看出,上层图像为观察场,表示观察者用肉眼看到的图像,也就是实际的图像,那么下层图像为标签场,它是通过对观察场中不同区域赋予不同的标签得到的,所以图像分割问题变为图像标记问题。
假设像素点个数是M*N,平面像素点集合为:S={s1,s2,...,sm*n},观测数据为F,p(F)为观测场的概率分布。ω记为图像的标记场,ω={ωs1,...,ωsM*N},ωs∈∧={0,1,...,L-1}为类别总数,p(w)是先验概率满足MRF模型。P(F/w)是观察场F对于标记值w的条件概率,也就是说,表示的是特定标记像素包含的灰度概率分布,明显是属于高斯分布的。
达到最大值,这样表明对于每个像素都得到最适宜的标签,即标签场和观察场最大限度地符合,意味着分割完成,这就是后验概率最大估计(MAP)估计。
实验
数据集:AR库分别随机选取150张无遮挡人脸,150张围巾遮挡以及150张眼镜遮挡人脸训练SVM。用720张图片用于检测分类效果。
实验结果:
实验数据:AR库上选取80个人(男女各一半)的240张无遮挡人脸,每人三张图像分别为自然表情,微笑和生气。选取三种光照条件下240张围巾遮挡图像和眼镜遮挡图像。
预处理:原图像大小768*576,归一化为128*128,并将图像分为64个16*16块用来提取LGBPHS特征。
实验结果
在面部表情为尖叫下实验结果
总结
这种在遮挡情况下精确检测的人脸识别框架,使用马尔科夫随机场模型精确定位遮挡位置,然后从非遮挡位置提取特征用于人脸识别。实验结果表明该框架的方法要优于其他传统方法。在未来研究研究方向上,在通常情况下的遮挡(包括眼镜,围巾也,胡须,长头发,戴帽子等)检测至关重要。
如果想加入我们“计算机视觉战队”,请扫二维码加入学习群。计算机视觉战队主要涉及机器学习、深度学习等领域,由来自于各校的硕博研究生组成的团队,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。