Facial expression recognition (FER) is a challenging problem because the expression component is always entangled with other irrelevant factors, such as identity and head pose. In this work, we propose an identity and pose disentangled facial expression recognition (IPD-FER) model to learn more discriminative feature representation. We regard the holistic facial representation as the combination of identity, pose and expression. These three components are encoded with different encoders. For identity encoder, a well pre-trained face recognition model is utilized and fixed during training, which alleviates the restriction on specific expression training data in previous works and makes the disentanglement practicable on in-the-wild datasets. At the same time, the pose and expression encoder are optimized with corresponding labels. Combining identity and pose feature, a neutral face of input individual should be generated by the decoder. When expression feature is added, the input image should be reconstructed. By comparing the difference between synthesized neutral and expressional images of the same individual, the expression component is further disentangled from identity and pose. Experimental results verify the effectiveness of our method on both lab-controlled and in-the-wild databases and we achieve state-of-the-art recognition performance.
翻译:脸部表达式识别( FER) 是一个具有挑战性的问题, 因为表达式组成部分总是与身份和头部姿势等其他不相关因素纠缠在一起。 在这项工作中, 我们提出一个身份, 并呈现一个分解的面部表达式识别( IPD- FER) 模型, 以学习更具歧视性的特征表达式。 我们认为, 整体面部表达式是身份、 外形和表达式的组合。 这三个组成部分是由不同的编码器编码的。 对于身份编码器来说, 在培训期间使用和固定了一个经过良好训练的面部识别模型, 从而减轻了以前作品中特定表达式培训数据的限制, 使得在电动数据集中出现分离的不切实际性。 同时, 将形状和表达式的编码器与相应的标签进行优化。 合并身份和显示特征和显示式的特性, 个人输入的中性面面面面面部表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式, 的表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式表示式