学界 | 新型半参数变分自动编码器DeepCoder：可分层级编码人脸动作 - 专知

会员服务 ·

0

学界 | 新型半参数变分自动编码器DeepCoder：可分层级编码人脸动作

2017 年 8 月 16 日 机器之心

选自arXiv

机器之心编译

参与：Panda

DeepCoder 是一个好名字，在今年的 ICLR 会议上，剑桥大学和微软就曾提出过一种 DeepCoder，可以组合其它程序代码来生成新程序，参阅机器之心的文章《学界 | 剑桥与微软提交 ICLR 2017 论文提出 DeepCoder：组合其它程序代码生成新程序》。前段时间，又有其他研究者提出了另一种 DeepCoder——一种用于自动面部动作编码的半参数变分自动编码器。机器之心对本文进行了摘要介绍。

论文：DeepCoder：用于自动面部动作编码的半参数变分自动编码器（DeepCoder: Semi-parametric Variational Autoencoders for Automatic Facial Action Coding）

论文地址：https://arxiv.org/pdf/1704.02206.pdf

人脸的表征能表现出一种固有的层次结构（即可以通过一套面部动作单元（AU）和它们的强度来对整体面部表情进行编码）。变分（深度）自动编码器（VAE）已经在大规模图像数据的层次化隐含表征的无监督提取上得到了优良的结果，同时还能在存在噪声和其它我们不想要的伪影时保持稳健。潜在地，这会使 VAE 成为一种学习 AU 强度估计的面部特征的合适方法。然而，大多数现有的基于 VAE 的方法都应用了与编码的特征分开学习到的分类器。相反，高斯过程（GP）等非参数（概率）方法通常比相对的参数方法表现更好，但却无法轻松处理大量数据。为此，我们提出了一种全新的 VAE 半参数建模框架 DeepCoder，它将参数（卷积）和非参数（ordinal GP）VAE 的建模能力结合到了一起，用以联合学习 (1) 任务层次中多个层级的隐含表征，(2) 多个有序输出的分类。我们在 AU 强度估计的基准数据集上的实验表明，我们提出的 DeepCoder 的表现优于当前最佳的方法以及相关的 VAE 和深度学习模型。

图 1：我们提出的 2 层 DeepCoder：输入是面部图像，输出是重建的面部图像和 AU 强度水平。顶部的变分卷积自动编码器（VAE）的表现比面部特征的第一级编码（Z0）更好，而这些特征的进一步编码（Z1）使用 ordinal GP 变分自动编码（VO-GPAE）针对 AU 强度估计进行了优化

算法 1：DeepCoder 的学习和推理

图 3：FERA2015：(a) MSE 重建误差，(b) VO-GPAE 的 NLPD，(c) 每个数据点估计的变分下限，(d) AU 强度估计的 ICC，和恢复的隐空间：Z0 (e) 和 Z1 (f)

本文为机器之心专栏，转载请联系本公众号获得授权。

✄------------------------------------------------

加入机器之心（全职记者/实习生）：hr@jiqizhixin.com

投稿或寻求报道：editor@jiqizhixin.com

广告&商务合作：bd@jiqizhixin.com

登录查看更多

3

相关内容

变分自编码

变分自编码

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

自动结构变分推理，Automatic structured variational inference

自动结构变分推理，Automatic structured variational inference

专知会员服务

40+阅读 · 2020年2月10日

【反馈循环自编码器】FEEDBACK RECURRENT AUTOENCODER

【反馈循环自编码器】FEEDBACK RECURRENT AUTOENCODER

专知会员服务

23+阅读 · 2020年1月28日

【论文】结构GANs，Structured GANs，

【论文】结构GANs，Structured GANs，

专知会员服务

15+阅读 · 2020年1月16日

近期必读的5篇 WSDM 2020【图神经网络（GNN）】相关论文

近期必读的5篇 WSDM 2020【图神经网络（GNN）】相关论文

专知会员服务

57+阅读 · 2020年1月10日

【WSDM 2020】RecVAE:一种新的变分自编码器，用于具有隐式反馈的Top-N推荐（RecVAE: a New Variational Autoencoder for Top-NRecommendations with Implicit Feedback）

【WSDM 2020】RecVAE:一种新的变分自编码器，用于具有隐式反馈的Top-N推荐（RecVAE: a New Variational Autoencoder for Top-NRecommendations with Implicit Feedback）

专知会员服务

32+阅读 · 2019年12月26日

【表示学习(Representation Learning)】8篇 NeurIPS 2019论文选读

专知会员服务

54+阅读 · 2019年12月22日

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

专知会员服务

28+阅读 · 2019年11月26日

【AAAI2020论文-NUS】用于联合实体和关系提取的编译码结构的有效建模

【AAAI2020论文-NUS】用于联合实体和关系提取的编译码结构的有效建模

专知会员服务

22+阅读 · 2019年11月22日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

学界 |《自然：神经科学》论文：动物视觉系统里的 RNN 能加速物体识别

学界 |《自然：神经科学》论文：动物视觉系统里的 RNN 能加速物体识别

AI科技评论

6+阅读 · 2019年4月30日

学界 | 3D形状补全新突破：MIT提出结合对抗学习形状先验的ShapeHD

学界 | 3D形状补全新突破：MIT提出结合对抗学习形状先验的ShapeHD

机器之心

4+阅读 · 2018年10月15日

如何在不同摄像头里识别行人？多层相似度感知CNN网络解析

如何在不同摄像头里识别行人？多层相似度感知CNN网络解析

阿里技术

4+阅读 · 2018年8月10日

学界 | 悉尼科技大学CVPR 2018论文：无监督学习下的增强人脸关键点检测器

学界 | 悉尼科技大学CVPR 2018论文：无监督学习下的增强人脸关键点检测器

AI科技评论

4+阅读 · 2018年7月5日

【学界】基于平行视觉的特定场景下行人检测

【学界】基于平行视觉的特定场景下行人检测

GAN生成式对抗网络

6+阅读 · 2018年1月15日

学界 | 清华大学提出SA-VAE框架，通过单样本/少样本学习生成任意风格的汉字

学界 | 清华大学提出SA-VAE框架，通过单样本/少样本学习生成任意风格的汉字

机器之心

3+阅读 · 2018年1月1日

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

机器之心

6+阅读 · 2017年11月10日

学界 | 中科院NIPS 2017论文提出深度离散哈希算法，可用于图像检索

学界 | 中科院NIPS 2017论文提出深度离散哈希算法，可用于图像检索

机器之心

6+阅读 · 2017年11月2日

教程 | 深度学习：自动编码器基础和类型

教程 | 深度学习：自动编码器基础和类型

机器之心

5+阅读 · 2017年9月23日

学界 | 遗传算法自动编写软件：新研究让AI开始代替程序员工作

学界 | 遗传算法自动编写软件：新研究让AI开始代替程序员工作

机器之心

4+阅读 · 2017年9月20日

A Probe into Understanding GAN and VAE models

A Probe into Understanding GAN and VAE models

Arxiv

9+阅读 · 2018年12月13日

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Arxiv

4+阅读 · 2018年11月21日

Discovering Discrete Latent Topics with Neural Variational Inference

Arxiv

9+阅读 · 2018年5月21日

Towards Training Probabilistic Topic Models on Neuromorphic Multi-chip Systems

Arxiv

3+阅读 · 2018年4月10日

Safety-aware Adaptive Reinforcement Learning with Applications to Brushbot Navigation

Arxiv

4+阅读 · 2018年1月29日

Detecting and counting tiny faces

Arxiv

4+阅读 · 2018年1月19日

Variational Recurrent Neural Machine Translation

Arxiv

5+阅读 · 2018年1月16日

Topic Modeling on Health Journals with Regularized Variational Inference

Arxiv

3+阅读 · 2018年1月15日

Negative Binomial Matrix Factorization for Recommender Systems

Arxiv

8+阅读 · 2018年1月5日

Continuous Time Dynamic Topic Models

Arxiv

3+阅读 · 2015年5月16日

VIP会员

相关主题

变分自编码

相关VIP内容

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

自动结构变分推理，Automatic structured variational inference

自动结构变分推理，Automatic structured variational inference

专知会员服务

40+阅读 · 2020年2月10日

【反馈循环自编码器】FEEDBACK RECURRENT AUTOENCODER

【反馈循环自编码器】FEEDBACK RECURRENT AUTOENCODER

专知会员服务

23+阅读 · 2020年1月28日

【论文】结构GANs，Structured GANs，

【论文】结构GANs，Structured GANs，

专知会员服务

15+阅读 · 2020年1月16日

近期必读的5篇 WSDM 2020【图神经网络（GNN）】相关论文

近期必读的5篇 WSDM 2020【图神经网络（GNN）】相关论文

专知会员服务

57+阅读 · 2020年1月10日

【WSDM 2020】RecVAE:一种新的变分自编码器，用于具有隐式反馈的Top-N推荐（RecVAE: a New Variational Autoencoder for Top-NRecommendations with Implicit Feedback）

【WSDM 2020】RecVAE:一种新的变分自编码器，用于具有隐式反馈的Top-N推荐（RecVAE: a New Variational Autoencoder for Top-NRecommendations with Implicit Feedback）

专知会员服务

32+阅读 · 2019年12月26日

【表示学习(Representation Learning)】8篇 NeurIPS 2019论文选读

专知会员服务

54+阅读 · 2019年12月22日

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

专知会员服务

28+阅读 · 2019年11月26日

【AAAI2020论文-NUS】用于联合实体和关系提取的编译码结构的有效建模

【AAAI2020论文-NUS】用于联合实体和关系提取的编译码结构的有效建模

专知会员服务

22+阅读 · 2019年11月22日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】逆强化学习中的部分可识别性与模型设定错误

投大模型岗？50道大型语言模型（LLM）面试问题汇总

深度学习的多视角三维重建技术综述

【ICML2025】扩散模型中参数高效微调的零样本适应

相关资讯

学界 |《自然：神经科学》论文：动物视觉系统里的 RNN 能加速物体识别

学界 |《自然：神经科学》论文：动物视觉系统里的 RNN 能加速物体识别

AI科技评论

6+阅读 · 2019年4月30日

学界 | 3D形状补全新突破：MIT提出结合对抗学习形状先验的ShapeHD

学界 | 3D形状补全新突破：MIT提出结合对抗学习形状先验的ShapeHD

机器之心

4+阅读 · 2018年10月15日

如何在不同摄像头里识别行人？多层相似度感知CNN网络解析

如何在不同摄像头里识别行人？多层相似度感知CNN网络解析

阿里技术

4+阅读 · 2018年8月10日

学界 | 悉尼科技大学CVPR 2018论文：无监督学习下的增强人脸关键点检测器

学界 | 悉尼科技大学CVPR 2018论文：无监督学习下的增强人脸关键点检测器

AI科技评论

4+阅读 · 2018年7月5日

【学界】基于平行视觉的特定场景下行人检测

【学界】基于平行视觉的特定场景下行人检测

GAN生成式对抗网络

6+阅读 · 2018年1月15日

学界 | 清华大学提出SA-VAE框架，通过单样本/少样本学习生成任意风格的汉字

学界 | 清华大学提出SA-VAE框架，通过单样本/少样本学习生成任意风格的汉字

机器之心

3+阅读 · 2018年1月1日

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

机器之心

6+阅读 · 2017年11月10日

学界 | 中科院NIPS 2017论文提出深度离散哈希算法，可用于图像检索

学界 | 中科院NIPS 2017论文提出深度离散哈希算法，可用于图像检索

机器之心

6+阅读 · 2017年11月2日

教程 | 深度学习：自动编码器基础和类型

教程 | 深度学习：自动编码器基础和类型

机器之心

5+阅读 · 2017年9月23日

学界 | 遗传算法自动编写软件：新研究让AI开始代替程序员工作

学界 | 遗传算法自动编写软件：新研究让AI开始代替程序员工作

机器之心

4+阅读 · 2017年9月20日

相关论文

A Probe into Understanding GAN and VAE models

A Probe into Understanding GAN and VAE models

Arxiv

9+阅读 · 2018年12月13日

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Arxiv

4+阅读 · 2018年11月21日

Discovering Discrete Latent Topics with Neural Variational Inference

Arxiv

9+阅读 · 2018年5月21日

Towards Training Probabilistic Topic Models on Neuromorphic Multi-chip Systems

Arxiv

3+阅读 · 2018年4月10日

Safety-aware Adaptive Reinforcement Learning with Applications to Brushbot Navigation

Arxiv

4+阅读 · 2018年1月29日

Detecting and counting tiny faces

Arxiv

4+阅读 · 2018年1月19日

Variational Recurrent Neural Machine Translation

Arxiv

5+阅读 · 2018年1月16日

Topic Modeling on Health Journals with Regularized Variational Inference

Arxiv

3+阅读 · 2018年1月15日

Negative Binomial Matrix Factorization for Recommender Systems

Arxiv

8+阅读 · 2018年1月5日

Continuous Time Dynamic Topic Models

Arxiv

3+阅读 · 2015年5月16日

大家都在搜

大型语言模型

CMU博士论文

软件无线电

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员