【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion - 专知VIP

会员服务 ·

2

CVPR 2022 · 计算机视觉 · 论文 · 代码 ·

2022 年 3 月 3 日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

● 论文摘要：提出了一个三维语义场景完成(SSC)框架，其中场景的密集几何和语义是由单目RGB图像推断出来的。与SSC文献不同，我们依靠2.5或3D输入，解决了2D到3D场景重建的复杂问题，同时联合推断其语义。我们的框架依赖于连续的2D和3D UNets，它由一种新颖的2D-3D特征投影连接起来，这种投影来源于光学，并在执行空间语义一致性之前引入了3D上下文关系。在建筑贡献的同时，我们介绍了新颖的全球场景和当地的圆锥台的损失。实验表明，我们在所有指标和数据集上的表现都优于文献，即使在相机视野之外，我们也能幻想出似是而非的风景。
● 论文主页：https://cv-rits.github.io/MonoScene/
● 论文链接：https://arxiv.org/abs/2112.00726
● 论文代码：https://github.com/cv-rits/MonoScene
● 作者单位：法国国家信息与自动化研究所（INRIA）

成为VIP会员查看完整内容

15

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【CVPR 2022】从大量非正式视频中构建可动画的3D神经模型，BANMo: Building Animatable 3D Neural Models from Many Casual Videos

【CVPR 2022】从大量非正式视频中构建可动画的3D神经模型，BANMo: Building Animatable 3D Neural Models from Many Casual Videos

专知会员服务

25+阅读 · 2022年3月3日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

【CVPR2021】双图层实例分割，大幅提升遮挡处理性能

专知会员服务

18+阅读 · 2021年5月23日

【CVPR2020】语义增强的场景文本识别的编码-解码器框架，SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

【CVPR2020】语义增强的场景文本识别的编码-解码器框架，SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

专知会员服务

25+阅读 · 2020年5月22日

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

泡泡机器人SLAM

34+阅读 · 2019年9月18日

【泡泡图灵智库】体积实例感知语义建图与3D对象发现

【泡泡图灵智库】体积实例感知语义建图与3D对象发现

泡泡机器人SLAM

22+阅读 · 2019年9月7日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

MaskFusion: 多运动目标实时识别、跟踪和重建

MaskFusion: 多运动目标实时识别、跟踪和重建

计算机视觉life

11+阅读 · 2019年4月20日

【泡泡点云时空】利用超点图的大场景点云语义分割(CVPR2018-5)

【泡泡点云时空】利用超点图的大场景点云语义分割(CVPR2018-5)

泡泡机器人SLAM

30+阅读 · 2018年8月14日

大规模数据集3D手语识别的研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于姿态估计的捷联惯导动机座初始对准技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

移动机器人基于三维激光测距的室内场景认知与物体识别

国家自然科学基金

0+阅读 · 2012年12月31日

基于图像序列的动态场景三维结构和运动恢复的鲁棒性算法

国家自然科学基金

0+阅读 · 2012年12月31日

基于特征结构关系的目标分类研究

国家自然科学基金

1+阅读 · 2012年12月31日

Photorealistic Monocular 3D Reconstruction of Humans Wearing Clothing

Arxiv

1+阅读 · 2022年4月19日

Shape-Aware Monocular 3D Object Detection

Arxiv

0+阅读 · 2022年4月19日

Learning Multi-View Aggregation In the Wild for Large-Scale 3D Semantic Segmentation

Learning Multi-View Aggregation In the Wild for Large-Scale 3D Semantic Segmentation

Arxiv

0+阅读 · 2022年4月15日

PL-VINS: Real-Time Monocular Visual-Inertial SLAM with Point and Line Features

Arxiv

1+阅读 · 2022年4月15日

Monocular Object and Plane SLAM in Structured Environments

Monocular Object and Plane SLAM in Structured Environments

Arxiv

12+阅读 · 2018年9月10日

VIP会员

相关主题

计算机视觉

相关VIP内容

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【CVPR 2022】从大量非正式视频中构建可动画的3D神经模型，BANMo: Building Animatable 3D Neural Models from Many Casual Videos

【CVPR 2022】从大量非正式视频中构建可动画的3D神经模型，BANMo: Building Animatable 3D Neural Models from Many Casual Videos

专知会员服务

25+阅读 · 2022年3月3日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

【CVPR2021】双图层实例分割，大幅提升遮挡处理性能

专知会员服务

18+阅读 · 2021年5月23日

【CVPR2020】语义增强的场景文本识别的编码-解码器框架，SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

【CVPR2020】语义增强的场景文本识别的编码-解码器框架，SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

专知会员服务

25+阅读 · 2020年5月22日

热门VIP内容

开通专知VIP会员享更多权益服务

【书籍】从零开始构建文本生成图像生成器：基于 Transformers 与扩散模型

人工智能与未来指挥

【伯克利博士论文】将大语言模型绑定至虚拟人格：实现人类行为模拟

稀疏自编码器综述：解释大语言模型的内部机制

相关资讯

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

泡泡机器人SLAM

34+阅读 · 2019年9月18日

【泡泡图灵智库】体积实例感知语义建图与3D对象发现

【泡泡图灵智库】体积实例感知语义建图与3D对象发现

泡泡机器人SLAM

22+阅读 · 2019年9月7日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

MaskFusion: 多运动目标实时识别、跟踪和重建

MaskFusion: 多运动目标实时识别、跟踪和重建

计算机视觉life

11+阅读 · 2019年4月20日

【泡泡点云时空】利用超点图的大场景点云语义分割(CVPR2018-5)

【泡泡点云时空】利用超点图的大场景点云语义分割(CVPR2018-5)

泡泡机器人SLAM

30+阅读 · 2018年8月14日

相关基金

大规模数据集3D手语识别的研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于姿态估计的捷联惯导动机座初始对准技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

移动机器人基于三维激光测距的室内场景认知与物体识别

国家自然科学基金

0+阅读 · 2012年12月31日

基于图像序列的动态场景三维结构和运动恢复的鲁棒性算法

国家自然科学基金

0+阅读 · 2012年12月31日

基于特征结构关系的目标分类研究

国家自然科学基金

1+阅读 · 2012年12月31日

相关论文

Photorealistic Monocular 3D Reconstruction of Humans Wearing Clothing

Arxiv

1+阅读 · 2022年4月19日

Shape-Aware Monocular 3D Object Detection

Arxiv

0+阅读 · 2022年4月19日

Learning Multi-View Aggregation In the Wild for Large-Scale 3D Semantic Segmentation

Learning Multi-View Aggregation In the Wild for Large-Scale 3D Semantic Segmentation

Arxiv

0+阅读 · 2022年4月15日

PL-VINS: Real-Time Monocular Visual-Inertial SLAM with Point and Line Features

Arxiv

1+阅读 · 2022年4月15日

Monocular Object and Plane SLAM in Structured Environments

Monocular Object and Plane SLAM in Structured Environments

Arxiv

12+阅读 · 2018年9月10日

微信扫码咨询专知VIP会员