Active Shape Model (ASM) is a statistical model of object shapes that represents a target structure. ASM can guide machine learning algorithms to fit a set of points representing an object (e.g., face) onto an image. This paper presents a lightweight Convolutional Neural Network (CNN) architecture with a loss function being assisted by ASM for face alignment and estimating head pose in the wild. We use ASM to first guide the network towards learning a smoother distribution of the facial landmark points. Inspired by transfer learning, during the training process, we gradually harden the regression problem and guide the network towards learning the original landmark points distribution. We define multi-tasks in our loss function that are responsible for detecting facial landmark points as well as estimating the face pose. Learning multiple correlated tasks simultaneously builds synergy and improves the performance of individual tasks. We compare the performance of our proposed model called ASMNet with MobileNetV2 (which is about 2 times bigger than ASMNet) in both the face alignment and pose estimation tasks. Experimental results on challenging datasets show that by using the proposed ASM assisted loss function, the ASMNet performance is comparable with MobileNetV2 in the face alignment task. In addition, for face pose estimation, ASMNet performs much better than MobileNetV2. ASMNet achieves an acceptable performance for facial landmark points detection and pose estimation while having a significantly smaller number of parameters and floating-point operations compared to many CNN-based models.
翻译:主动形状模型(ASM) 是一个代表目标结构的物体形状的统计模型。 ASM 可以指导机器学习算法, 以将代表对象( 如脸) 的一组点数( 如脸) 与图像相匹配。 本文展示了一个轻量的进进进神经网络(CNN)架构, 其损失功能由ASM协助进行, 以进行脸对齐和估计野外头头部构成。 我们使用ASM 来首先指导网络, 以了解更平稳的面部标志性点分布。 在培训过程中,我们通过转移学习, 逐步强化回归问题, 指导网络学习最初的里程碑点分布。 我们定义了我们损失函数中代表对象( 如脸部)的一组点( 如脸部) 的多任务。 本文介绍了一个轻量的进化神经神经网络( CNN) 结构( CNN) 结构( ) 结构多相关的任务同时建立协同效应, 并改进了各项任务的绩效。 我们用我们提议的名为ASMNet的模型( 比ASMNet 2 ) 和移动网络 2 (比ASMNet 2 ) ) 的功能在面对面和浮动估计任务中, 。 的数值评估中, 通过使用一个更小的比较一个可接受的SMSM2, 的SM2,,,, 动作将一个可理解的动作性工作进行 性能 性能 性 性, 性 性 性 性能 性能, 性 性能 性能 性能 性能 性能 性能 性能 性能 性能 性能和 性能 性能 性能 性能 性能 性能 性 性能 性能 性能 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性能 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性 性