从1小时到3.5分钟，Meta新算法一部手机搞定3D人脸数据采集，可用于VR的那种

会员服务 ·

从1小时到3.5分钟，Meta新算法一部手机搞定3D人脸数据采集，可用于VR的那种

2022 年 7 月 6 日 量子位

鱼羊发自凹非寺
量子位 | 公众号 QbitAI

搞定这样的人脸3D建模需要几步？

在数据采集的阶段，答案是：一部手机 + 3.5分钟。

没错，仅凭这3.5分钟的数据，就足以生成高保真、可驱动的真实3D人脸头像。

这项研究来自Meta Reality Labs——就是扎克伯格元宇宙计划里的那个核心部门。论文已经被SIGGRAPH 2022接收。

作者提到，这一方法适用于VR应用。

也就是说，在VR的世界里，以后你可能就不必顶着一张卡通脸登场了。

而是可以方便地与胖友们“真身”相见。

方法原理

实现这一结果的方法框架如下图所示：

具体而言，分为三个部分。

首先，是要用大型多视角人脸数据集训练一个超网络，这个超网络可以通过神经网络解码器产生专属于个人的头像参数。

数据集中的人脸由多视角捕捉系统采集，包括255位不同年龄、性别和种族参与者的面部图像数据。

△左为图像捕获设备；右为采集到的人脸

这个捕获3D人脸的巨型装置是Meta在2019年研发的，其中配备171个高分辨率摄像头，每秒能记录180GB数据。采集时间在1个小时左右。

值得一提的是，在这个超网络中，解码器的基本组成模块是带有bias map的卷积上采样层。

这些bias map会被用来生成体积单元，进而通过射线追踪来渲染头像。

另外，该解码器结构能够将视线与其他面部活动区分开，这在VR应用中意味着能够更直接地利用眼动跟踪系统。

其次，是轻量级人脸表情捕捉。

在这项研究中，采集人脸只需要用到一部带有深度摄像头的智能手机。

实验中，研究人员采用的是iPhone 12。

采集过程就像这样：

采集到的数据要进行如下处理：

获取每一帧人脸图像中的几何形状和纹理；
对输入的RGB图像进行人脸标志检测和人像分割；
对模板网格进行拟合和变形，以匹配检测到的人脸标志物、分割轮廓和深度图；
对每一帧图像的纹理进行解包，而后汇总得到完整的人脸纹理。

在进一步完善模型的过程中，还需要采集65种特定的表情：

最后，该方法输出的3D人脸头像不仅能与用户外观高度匹配，通过全局表情空间，还能对其进行进一步的驱动、控制。

研究人员表示，整个采集过程大概要花费3.5分钟。

不过需要说明的是，建模的过程不是实时的，数据处理还要花费数小时的时间。

实验结果

说了这么多，效果如何，我们还是来看实验结果。

与Pinscreen提出的“一张照片构建3D数字化身”（CVPR 2021）的方法相比，该方法能生成更具真实感的人脸模型。

而与海德堡大学、慕尼黑工业大学、马普所等研究机构在Neural Head Avatars from Monocular RGB Videos一文中提出的方法相比，该方法能生成保真度更高的结果。

不过，作者也指出了该方法的局限性：hold不太住长发和眼镜，容易产生伪影。另外，该方法对于光照条件也有一定要求。

参考链接：
[1]论文：https://drive.google.com/file/d/1i4NJKAggS82wqMamCJ1OHRGgViuyoY6R/view
[2]Demo：https://www.youtube.com/watch?v=t7_TMD7v0Xs

— 完 —

「量子位·视点」直播报名

什么是“智能决策”？智能决策的关键技术是什么？它又将如何打造引领企业二次增长的“智能抓手”？

7月7日周四，参与直播，为你解答～

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

登录查看更多

相关内容

人脸

关注 0

深度学习视频超分辨率技术概述

专知会员服务

38+阅读 · 2022年7月18日

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

专知会员服务

12+阅读 · 2022年3月22日

【ICLR 2022】MIT论文解读：谈到人工智能，我们可以抛弃数据集吗？基于ML创建合成数据，Generative Models As A Data Source For Multiview Representation Learning

专知会员服务

41+阅读 · 2022年3月15日

【CVPR 2022】paper解读——从头盔信号中解析生成3D姿势，这为AR/VR创造可信虚拟形象迈出了重要一步，FLAG: Flow-based 3D Avatar Generation from Sparse Observations

专知会员服务

19+阅读 · 2022年3月6日

何恺明团队新论文！自监督学习+Transformer=MoCoV3，解决训练不稳定性

专知会员服务

37+阅读 · 2021年4月7日

靠网上晒的景点照就能还原3D建模，浙大团队这是要带我们云旅游？｜SIGGRAPH 2022

量子位

1+阅读 · 2022年5月27日

CVPR 2022 | 5秒手机猫片也能重建猫咪3D模型！Meta提出BANMo：为变形物体3D重建

CVer

1+阅读 · 2022年3月9日

5秒手机猫片也能重建猫咪3D模型，Meta提出新算法为变形物体建模 | CVPR 2022

量子位

1+阅读 · 2022年3月4日

这个AI能帮你快速搜监控：文字定位关键画面，24小时录像10分钟处理完

量子位

0+阅读 · 2022年1月23日

朱俊彦团队最新论文：用GAN监督学习给猫狗加表情！真的很丝滑！

CVer

0+阅读 · 2021年12月29日

面向海量数据实时采集的PM2.5个体暴露评价方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

结合超分辨率重建的图像及视频新型压缩编码技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于单张低精度深度图的实时精确三维曲面重建

国家自然科学基金

0+阅读 · 2012年12月31日

基于深度相机的动态模型三维扫描重建

国家自然科学基金

0+阅读 · 2012年12月31日

基于光场的高动态范围超分辨率成像研究

国家自然科学基金

1+阅读 · 2012年12月31日

Viewer-Centred Surface Completion for Unsupervised Domain Adaptation in 3D Object Detection

Arxiv

0+阅读 · 2022年9月14日

Time-of-Day Neural Style Transfer for Architectural Photographs

Arxiv

0+阅读 · 2022年9月13日

Learning Perturbations for Soft-Output Linear MIMO Demappers

Arxiv

0+阅读 · 2022年9月9日

HyperMAML: Few-Shot Adaptation of Deep Models with Hypernetworks

Arxiv

0+阅读 · 2022年9月9日

Faster Meta Update Strategy for Noise-Robust Deep Learning

Arxiv

11+阅读 · 2021年4月30日

VIP会员