【ICCV2021】视频自动编码器:自监督解纠缠的静态3D结构和运动 - 专知VIP

会员服务 ·

1

视频自动编码器 · 自监督学习 · 解纠缠学习 · ICCV 2021 ·

2021 年 10 月 8 日

【ICCV2021】视频自动编码器:自监督解纠缠的静态3D结构和运动

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文提出了一种视频自动编码器，以自监督的方式从视频中学习三维结构和摄像机姿态的分离表示。基于视频中的时间连续性，我们的工作假设邻近视频帧中的3D场景结构保持静态。给定一个视频帧序列作为输入，视频自动编码器提取场景的解纠缠表示，包括: (i)一个时间一致的深度体素特征来表示3D结构，(ii) 每一帧的摄像机姿态的3D轨迹。然后，这两个表示将重新纠缠，以渲染输入视频帧。这个视频自动编码器可以直接使用像素重建损失训练，没有任何地面真实3D或相机姿态标注。解纠缠表示可以应用于一系列任务，包括新颖的视图合成、摄像机姿态估计和通过运动跟踪生成视频。我们在几个大尺度的自然视频数据集上评价了我们的方法，并在域外图像上展示了泛化结果。

https://www.zhuanzhi.ai/paper/ea270d15e2966f9de28d31cb9b66c1db

成为VIP会员查看完整内容

9

相关内容

视频自动编码器

视频自动编码器

【NeurIPS2021】NeRV:视频的神经表示

【NeurIPS2021】NeRV:视频的神经表示

专知会员服务

12+阅读 · 2021年10月28日

【NeurIPS 2021】使用动态图进行3D目标检测

专知会员服务

15+阅读 · 2021年10月15日

【ICCV2021】模态视频表示的跨模态对比学习

专知会员服务

16+阅读 · 2021年10月4日

【NeurIPS 2021】深度上下文视频压缩

专知会员服务

8+阅读 · 2021年10月4日

【ICCV2021】通过动作外观对齐的元适应无监督的少样本动作识别

专知会员服务

13+阅读 · 2021年10月1日

【ICML2021】通过乘积流形投影学习解纠缠表示

专知会员服务

7+阅读 · 2021年9月20日

【ICML2021】生成式视频转换器Transformers: 物体可以是文字吗?

专知会员服务

13+阅读 · 2021年8月20日

【ICML2021】学习对称解纠缠多对象表示的有效迭代平摊推理

专知会员服务

15+阅读 · 2021年6月9日

CVPR2021-单目实时全身捕捉的方法

专知会员服务

20+阅读 · 2021年3月18日

近期必读的五篇 NeurIPS 2020【三维点云分析】相关论文和代码

专知会员服务

29+阅读 · 2020年12月29日

【泡泡图灵智库】基于RGB-D相机多视图深度学习的一致语义建图

【泡泡图灵智库】基于RGB-D相机多视图深度学习的一致语义建图

泡泡机器人SLAM

12+阅读 · 2019年9月3日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

泡泡机器人SLAM

41+阅读 · 2019年5月19日

【泡泡图灵智库】基于几何一致性网络的摄像机运动估计

【泡泡图灵智库】基于几何一致性网络的摄像机运动估计

泡泡机器人SLAM

9+阅读 · 2019年5月13日

【泡泡点云时空】集成深度语义分割的3D点云配准

【泡泡点云时空】集成深度语义分割的3D点云配准

泡泡机器人SLAM

28+阅读 · 2018年11月24日

【泡泡点云时空】3DMV:联合三维多视图预测的三维语义场景分割(ECCV2018-7)

【泡泡点云时空】3DMV:联合三维多视图预测的三维语义场景分割(ECCV2018-7)

泡泡机器人SLAM

9+阅读 · 2018年10月16日

【泡泡点云时空】PointFusion：深度传感器融合估计3D包围盒(CVPR2018-16)

【泡泡点云时空】PointFusion：深度传感器融合估计3D包围盒(CVPR2018-16)

泡泡机器人SLAM

7+阅读 · 2018年9月26日

【泡泡图灵智库】GeoNet：基于无监督学习的深度、光流和相机位姿的联合估计

【泡泡图灵智库】GeoNet：基于无监督学习的深度、光流和相机位姿的联合估计

泡泡机器人SLAM

7+阅读 · 2018年6月24日

【泡泡一分钟】SfM-Net：从视频中学习结构和运动

【泡泡一分钟】SfM-Net：从视频中学习结构和运动

泡泡机器人SLAM

9+阅读 · 2018年5月29日

Camera Motion Agnostic 3D Human Pose Estimation

Arxiv

0+阅读 · 2021年12月1日

PoseKernelLifter: Metric Lifting of 3D Human Pose using Sound

Arxiv

0+阅读 · 2021年12月1日

Voint Cloud: Multi-View Point Cloud Representation for 3D Understanding

Arxiv

0+阅读 · 2021年11月30日

PlantStereo: A Stereo Matching Benchmark for Plant Surface Dense Reconstruction

Arxiv

0+阅读 · 2021年11月30日

Points2Sound: From mono to binaural audio using 3D point cloud scenes

Arxiv

0+阅读 · 2021年11月25日

Joint stereo 3D object detection and implicit surface reconstruction

Arxiv

0+阅读 · 2021年11月25日

HuMoR: 3D Human Motion Model for Robust Pose Estimation

Arxiv

3+阅读 · 2021年5月10日

PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object Detection

Arxiv

4+阅读 · 2020年12月21日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

Fine-grained Activity Recognition in Baseball Videos

Arxiv

6+阅读 · 2018年4月9日

VIP会员

相关主题

视频自动编码器

自监督学习

解纠缠学习

相关VIP内容

【NeurIPS2021】NeRV:视频的神经表示

【NeurIPS2021】NeRV:视频的神经表示

专知会员服务

12+阅读 · 2021年10月28日

【NeurIPS 2021】使用动态图进行3D目标检测

专知会员服务

15+阅读 · 2021年10月15日

【ICCV2021】模态视频表示的跨模态对比学习

专知会员服务

16+阅读 · 2021年10月4日

【NeurIPS 2021】深度上下文视频压缩

专知会员服务

8+阅读 · 2021年10月4日

【ICCV2021】通过动作外观对齐的元适应无监督的少样本动作识别

专知会员服务

13+阅读 · 2021年10月1日

【ICML2021】通过乘积流形投影学习解纠缠表示

专知会员服务

7+阅读 · 2021年9月20日

【ICML2021】生成式视频转换器Transformers: 物体可以是文字吗?

专知会员服务

13+阅读 · 2021年8月20日

【ICML2021】学习对称解纠缠多对象表示的有效迭代平摊推理

专知会员服务

15+阅读 · 2021年6月9日

CVPR2021-单目实时全身捕捉的方法

专知会员服务

20+阅读 · 2021年3月18日

近期必读的五篇 NeurIPS 2020【三维点云分析】相关论文和代码

专知会员服务

29+阅读 · 2020年12月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

多模态大语言模型下游调优中“保持自我”的重要性

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

相关资讯

【泡泡图灵智库】基于RGB-D相机多视图深度学习的一致语义建图

【泡泡图灵智库】基于RGB-D相机多视图深度学习的一致语义建图

泡泡机器人SLAM

12+阅读 · 2019年9月3日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

泡泡机器人SLAM

41+阅读 · 2019年5月19日

【泡泡图灵智库】基于几何一致性网络的摄像机运动估计

【泡泡图灵智库】基于几何一致性网络的摄像机运动估计

泡泡机器人SLAM

9+阅读 · 2019年5月13日

【泡泡点云时空】集成深度语义分割的3D点云配准

【泡泡点云时空】集成深度语义分割的3D点云配准

泡泡机器人SLAM

28+阅读 · 2018年11月24日

【泡泡点云时空】3DMV:联合三维多视图预测的三维语义场景分割(ECCV2018-7)

【泡泡点云时空】3DMV:联合三维多视图预测的三维语义场景分割(ECCV2018-7)

泡泡机器人SLAM

9+阅读 · 2018年10月16日

【泡泡点云时空】PointFusion：深度传感器融合估计3D包围盒(CVPR2018-16)

【泡泡点云时空】PointFusion：深度传感器融合估计3D包围盒(CVPR2018-16)

泡泡机器人SLAM

7+阅读 · 2018年9月26日

【泡泡图灵智库】GeoNet：基于无监督学习的深度、光流和相机位姿的联合估计

【泡泡图灵智库】GeoNet：基于无监督学习的深度、光流和相机位姿的联合估计

泡泡机器人SLAM

7+阅读 · 2018年6月24日

【泡泡一分钟】SfM-Net：从视频中学习结构和运动

【泡泡一分钟】SfM-Net：从视频中学习结构和运动

泡泡机器人SLAM

9+阅读 · 2018年5月29日

相关论文

Camera Motion Agnostic 3D Human Pose Estimation

Arxiv

0+阅读 · 2021年12月1日

PoseKernelLifter: Metric Lifting of 3D Human Pose using Sound

Arxiv

0+阅读 · 2021年12月1日

Voint Cloud: Multi-View Point Cloud Representation for 3D Understanding

Arxiv

0+阅读 · 2021年11月30日

PlantStereo: A Stereo Matching Benchmark for Plant Surface Dense Reconstruction

Arxiv

0+阅读 · 2021年11月30日

Points2Sound: From mono to binaural audio using 3D point cloud scenes

Arxiv

0+阅读 · 2021年11月25日

Joint stereo 3D object detection and implicit surface reconstruction

Arxiv

0+阅读 · 2021年11月25日

HuMoR: 3D Human Motion Model for Robust Pose Estimation

Arxiv

3+阅读 · 2021年5月10日

PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object Detection

Arxiv

4+阅读 · 2020年12月21日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

Fine-grained Activity Recognition in Baseball Videos

Arxiv

6+阅读 · 2018年4月9日

微信扫码咨询专知VIP会员