【CVPR 2022】从大量非正式视频中构建可动画的3D神经模型，BANMo: Building Animatable 3D Neural Models from Many Casual Videos - 专知VIP

会员服务 ·

1

CVPR 2022 · 计算机视觉 · 神经模型 · 3D 模型 · 论文 ·

2022 年 3 月 3 日

【CVPR 2022】从大量非正式视频中构建可动画的3D神经模型，BANMo: Building Animatable 3D Neural Models from Many Casual Videos

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

【从大量非正式视频中构建可动画的3D神经模型】BANMo: Building Animatable 3D Neural Models from Many Casual Videos
● 论文摘要：之前关于铰接式三维形状重建的工作通常依赖于专门的传感器(如同步多摄像机系统)，或预先构建的三维可变形模型(如SMAL或SMPL)。这些方法不能扩展到野外的不同对象集。我们提出BANMo，一种既不需要专门的传感器也不需要预定义的模板形状的方法。BANMo在一个可区分的渲染框架中，从许多单目休闲视频中构建高保真、铰连的3D模型(包括形状和动画皮肤权重)。虽然许多视频的使用提供了更多的摄像机视图和物体清晰度的覆盖，但它们在建立不同背景、光照条件等场景之间的对应关系方面带来了重大挑战。我们的主要观点是融合三个学派的思想;(1)利用关节骨和混合皮肤的经典变形形状模型，(2)适用于基于梯度的优化的体积神经辐射场(NeRFs)，以及(3)生成像素和关节模型之间对应的规范嵌入。我们引入神经混合蒙皮模型，允许可微和可逆铰接变形。当与规范嵌入相结合时，这样的模型允许我们在视频之间建立密集的对应关系，这些对应关系可以通过周期一致性进行自我监督。在真实数据集和合成数据集上，BANMo展示了比之前的人类和动物作品更高保真度的3D重建，能够从新颖的视角和姿势呈现逼真的图像。
● 论文主页：https://banmo-www.github.io/
● 论文链接：https://arxiv.org/abs/2112.12761
● 论文代码：https://github.com/facebookresearch/banmo
● 数据集：AMA
● 论文视频：https://banmo-www.github.io/cats.html
● 作者单位：Meta、卡耐基梅隆大学

成为VIP会员查看完整内容

25

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CVPR2022】多视图聚合的大规模三维语义分割

【CVPR2022】多视图聚合的大规模三维语义分割

专知会员服务

21+阅读 · 2022年4月20日

【NeurIPS 2021-康奈尔大学Guandao Yang】基于神经场的几何处理，Geometry Processing with Neural Fields

【NeurIPS 2021-康奈尔大学Guandao Yang】基于神经场的几何处理，Geometry Processing with Neural Fields

专知会员服务

25+阅读 · 2022年3月27日

【CVPR2022】用于全身图像生成的 InsetGAN

【CVPR2022】用于全身图像生成的 InsetGAN

专知会员服务

26+阅读 · 2022年3月17日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

15+阅读 · 2022年3月3日

【CVPR 2022】可控图像合成与编辑的合成生成先验学习，SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing

【CVPR 2022】可控图像合成与编辑的合成生成先验学习，SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing

专知会员服务

23+阅读 · 2022年3月3日

【ICCV2021】视频自动编码器:自监督解纠缠的静态3D结构和运动

专知会员服务

9+阅读 · 2021年10月8日

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

专知会员服务

68+阅读 · 2020年11月9日

ECCV 2020 五项大奖出炉！普林斯顿邓嘉获最佳论文奖

ECCV 2020 五项大奖出炉！普林斯顿邓嘉获最佳论文奖

专知会员服务

18+阅读 · 2020年8月25日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

CVPR 2022｜中国科大等提出点云连续隐式表示Neural Points：上采样任务效果惊艳！

CVPR 2022｜中国科大等提出点云连续隐式表示Neural Points：上采样任务效果惊艳！

极市平台

0+阅读 · 2022年3月23日

两张照片就能转视频！Google提出FLIM帧插值模型

两张照片就能转视频！Google提出FLIM帧插值模型

新智元

1+阅读 · 2022年3月11日

CVPR 2022 | 5秒手机猫片也能重建猫咪3D模型！Meta提出BANMo：为变形物体3D重建

CVPR 2022 | 5秒手机猫片也能重建猫咪3D模型！Meta提出BANMo：为变形物体3D重建

CVer

1+阅读 · 2022年3月9日

5秒手机猫片也能重建猫咪3D模型，Meta提出新算法为变形物体建模 | CVPR 2022

5秒手机猫片也能重建猫咪3D模型，Meta提出新算法为变形物体建模 | CVPR 2022

量子位

1+阅读 · 2022年3月4日

3张图片生成一个手办3D模型！南加州大学华人博士提出新模型NeROIC，更真实！

3张图片生成一个手办3D模型！南加州大学华人博士提出新模型NeROIC，更真实！

新智元

1+阅读 · 2022年2月24日

TPAMI 2021｜VideoDG:首个视频领域泛化模型

TPAMI 2021｜VideoDG:首个视频领域泛化模型

专知

0+阅读 · 2021年12月31日

神经辐射场去掉「神经」，训练速度提升100多倍，3D效果质量不减

神经辐射场去掉「神经」，训练速度提升100多倍，3D效果质量不减

机器之心

2+阅读 · 2021年12月27日

自动生成模型动画：北大神经融合形状新方法登上SIGGRAPH 2021

自动生成模型动画：北大神经融合形状新方法登上SIGGRAPH 2021

机器之心

1+阅读 · 2021年5月7日

CVPR 2019 论文大盘点-目标跟踪篇

CVPR 2019 论文大盘点-目标跟踪篇

极市平台

20+阅读 · 2019年8月8日

CVPR2019| 9篇CVPR论文开源代码（行人检测/物体检测/3D Face等）

CVPR2019| 9篇CVPR论文开源代码（行人检测/物体检测/3D Face等）

极市平台

12+阅读 · 2019年5月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

基于全向深度视觉的高精度人体肢体运动三维重建研究

国家自然科学基金

0+阅读 · 2014年12月31日

多模态融合的大规模网络视频名人标注研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的时序3D深度图动作语义理解

国家自然科学基金

2+阅读 · 2013年12月31日

视频中交互行为的表示与理解方法

国家自然科学基金

1+阅读 · 2012年12月31日

基于视频的行人检测和行为识别研究

国家自然科学基金

2+阅读 · 2012年12月31日

儿童从3D媒体中能学得更快更多吗？——三维媒体到现实世界的迁移学习机制

国家自然科学基金

0+阅读 · 2012年12月31日

用于交通管理的复杂拥挤环境下协同视频监控理论和方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

具有沿肿瘤靶向通路多级递次解组装特性的传输载体研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于视频语义理解的艺术风格化研究

国家自然科学基金

1+阅读 · 2009年12月31日

An unsupervised approach for semantic place annotation of trajectories based on the prior probability

Arxiv

0+阅读 · 2022年4月20日

BEAT: A Large-Scale Semantic and Emotional Multi-Modal Dataset for Conversational Gestures Synthesis

Arxiv

0+阅读 · 2022年4月19日

Pushing the Limits of Simple Pipelines for Few-Shot Learning: External Data and Fine-Tuning Make a Difference

Arxiv

0+阅读 · 2022年4月15日

Separating the World and Ego Models for Self-Driving

Arxiv

0+阅读 · 2022年4月14日

Learning and Evaluating Graph Neural Network Explanations based on Counterfactual and Factual Reasoning

Arxiv

17+阅读 · 2022年2月17日

On Neural Differential Equations

Arxiv

23+阅读 · 2022年2月4日

Collective Intelligence for Deep Learning: A Survey of Recent Developments

Arxiv

22+阅读 · 2021年12月22日

A survey of embedding models of entities and relationships for knowledge graph completion

Arxiv

23+阅读 · 2020年8月10日

A Unified Knowledge Representation and Context-aware Recommender System in Internet of Things

Arxiv

10+阅读 · 2018年5月10日

Adversarial Learning for Chinese NER from Crowd Annotations

Arxiv

15+阅读 · 2018年1月16日

VIP会员

相关主题

计算机视觉

相关VIP内容

【CVPR2022】多视图聚合的大规模三维语义分割

【CVPR2022】多视图聚合的大规模三维语义分割

专知会员服务

21+阅读 · 2022年4月20日

【NeurIPS 2021-康奈尔大学Guandao Yang】基于神经场的几何处理，Geometry Processing with Neural Fields

【NeurIPS 2021-康奈尔大学Guandao Yang】基于神经场的几何处理，Geometry Processing with Neural Fields

专知会员服务

25+阅读 · 2022年3月27日

【CVPR2022】用于全身图像生成的 InsetGAN

【CVPR2022】用于全身图像生成的 InsetGAN

专知会员服务

26+阅读 · 2022年3月17日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

15+阅读 · 2022年3月3日

【CVPR 2022】可控图像合成与编辑的合成生成先验学习，SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing

【CVPR 2022】可控图像合成与编辑的合成生成先验学习，SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing

专知会员服务

23+阅读 · 2022年3月3日

【ICCV2021】视频自动编码器:自监督解纠缠的静态3D结构和运动

专知会员服务

9+阅读 · 2021年10月8日

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

专知会员服务

68+阅读 · 2020年11月9日

ECCV 2020 五项大奖出炉！普林斯顿邓嘉获最佳论文奖

ECCV 2020 五项大奖出炉！普林斯顿邓嘉获最佳论文奖

专知会员服务

18+阅读 · 2020年8月25日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

热门VIP内容

开通专知VIP会员享更多权益服务

面向性能、成本效益、云边隐私与可信性的大小语言模型协作综述

乌克兰太空研究（2022-2024年） | 176页

【CMU博士论文】大型语言模型的隐性特性

国防领域人工智能走向何方？

相关资讯

CVPR 2022｜中国科大等提出点云连续隐式表示Neural Points：上采样任务效果惊艳！

CVPR 2022｜中国科大等提出点云连续隐式表示Neural Points：上采样任务效果惊艳！

极市平台

0+阅读 · 2022年3月23日

两张照片就能转视频！Google提出FLIM帧插值模型

两张照片就能转视频！Google提出FLIM帧插值模型

新智元

1+阅读 · 2022年3月11日

CVPR 2022 | 5秒手机猫片也能重建猫咪3D模型！Meta提出BANMo：为变形物体3D重建

CVPR 2022 | 5秒手机猫片也能重建猫咪3D模型！Meta提出BANMo：为变形物体3D重建

CVer

1+阅读 · 2022年3月9日

5秒手机猫片也能重建猫咪3D模型，Meta提出新算法为变形物体建模 | CVPR 2022

5秒手机猫片也能重建猫咪3D模型，Meta提出新算法为变形物体建模 | CVPR 2022

量子位

1+阅读 · 2022年3月4日

3张图片生成一个手办3D模型！南加州大学华人博士提出新模型NeROIC，更真实！

3张图片生成一个手办3D模型！南加州大学华人博士提出新模型NeROIC，更真实！

新智元

1+阅读 · 2022年2月24日

TPAMI 2021｜VideoDG:首个视频领域泛化模型

TPAMI 2021｜VideoDG:首个视频领域泛化模型

专知

0+阅读 · 2021年12月31日

神经辐射场去掉「神经」，训练速度提升100多倍，3D效果质量不减

神经辐射场去掉「神经」，训练速度提升100多倍，3D效果质量不减

机器之心

2+阅读 · 2021年12月27日

自动生成模型动画：北大神经融合形状新方法登上SIGGRAPH 2021

自动生成模型动画：北大神经融合形状新方法登上SIGGRAPH 2021

机器之心

1+阅读 · 2021年5月7日

CVPR 2019 论文大盘点-目标跟踪篇

CVPR 2019 论文大盘点-目标跟踪篇

极市平台

20+阅读 · 2019年8月8日

CVPR2019| 9篇CVPR论文开源代码（行人检测/物体检测/3D Face等）

CVPR2019| 9篇CVPR论文开源代码（行人检测/物体检测/3D Face等）

极市平台

12+阅读 · 2019年5月31日

相关基金

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

基于全向深度视觉的高精度人体肢体运动三维重建研究

国家自然科学基金

0+阅读 · 2014年12月31日

多模态融合的大规模网络视频名人标注研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的时序3D深度图动作语义理解

国家自然科学基金

2+阅读 · 2013年12月31日

视频中交互行为的表示与理解方法

国家自然科学基金

1+阅读 · 2012年12月31日

基于视频的行人检测和行为识别研究

国家自然科学基金

2+阅读 · 2012年12月31日

儿童从3D媒体中能学得更快更多吗？——三维媒体到现实世界的迁移学习机制

国家自然科学基金

0+阅读 · 2012年12月31日

用于交通管理的复杂拥挤环境下协同视频监控理论和方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

具有沿肿瘤靶向通路多级递次解组装特性的传输载体研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于视频语义理解的艺术风格化研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

An unsupervised approach for semantic place annotation of trajectories based on the prior probability

Arxiv

0+阅读 · 2022年4月20日

BEAT: A Large-Scale Semantic and Emotional Multi-Modal Dataset for Conversational Gestures Synthesis

Arxiv

0+阅读 · 2022年4月19日

Pushing the Limits of Simple Pipelines for Few-Shot Learning: External Data and Fine-Tuning Make a Difference

Arxiv

0+阅读 · 2022年4月15日

Separating the World and Ego Models for Self-Driving

Arxiv

0+阅读 · 2022年4月14日

Learning and Evaluating Graph Neural Network Explanations based on Counterfactual and Factual Reasoning

Arxiv

17+阅读 · 2022年2月17日

On Neural Differential Equations

Arxiv

23+阅读 · 2022年2月4日

Collective Intelligence for Deep Learning: A Survey of Recent Developments

Arxiv

22+阅读 · 2021年12月22日

A survey of embedding models of entities and relationships for knowledge graph completion

Arxiv

23+阅读 · 2020年8月10日

A Unified Knowledge Representation and Context-aware Recommender System in Internet of Things

Arxiv

10+阅读 · 2018年5月10日

Adversarial Learning for Chinese NER from Crowd Annotations

Arxiv

15+阅读 · 2018年1月16日

微信扫码咨询专知VIP会员