【斯坦福博士论文】具有高效时空推理的三维场景理解，122页pdf - 专知

会员服务 ·

0

【斯坦福博士论文】具有高效时空推理的三维场景理解，122页pdf

2022 年 9 月 26 日 专知

鲁棒和高效的3D场景理解可以使具身智能体实时安全地与物理世界交互。过去十年计算机视觉取得显著成功的关键在于卷积神经网络的重新发现。然而，由于维度的诅咒，这种技术并不总是直接转化为3D。数据的大小随着体素的增加呈立方体增长，同样水平的输入分辨率和网络深度与2D相比是不可行的。基于对三维空间基本为空的观察，稀疏张量和稀疏卷积由于只作用于非空的空间，作为二维卷积的高效的三维对应物而突出出来。这种效率增益支持更深入的神经网络，以获得实时参考速度的更高精度。为此，本文探讨了稀疏卷积在各种3D场景理解任务中的应用。

https://searchworks.stanford.edu/view/14311969

本文将一个整体的3D场景理解流程分解为以下子目标:1.三维重建数据采集; 2. 语义分割,3. 目标检测; 4. 多目标跟踪。考虑到机器人应用，本文旨在实现更好的性能、可扩展性和效率，以理解时空域的高级语义，同时解决稀疏数据所提出的独特挑战。在这篇论文中，我们提出了广义稀疏卷积，并演示了我们的方法1。利用三维点云的稀疏性来提高效率。利用所获得的效率，实现了鲁棒的性能，3。通过动态生成点对空白空间进行预测;结合时空推理解决检测跟踪问题。总之，本文提出了一种高效、可靠的三维场景整体理解途径。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“D122” 就可以获取《【斯坦福博士论文】具有高效时空推理的三维场景理解，122页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

1

相关内容

场景理解

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

专知会员服务

45+阅读 · 2022年9月29日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知会员服务

126+阅读 · 2022年9月11日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知会员服务

89+阅读 · 2022年7月11日

【斯坦福博士论文】视觉语言的多模态表示，102页pdf

专知会员服务

73+阅读 · 2021年7月29日

【斯坦福博士论文】深度学习医学图像解译，207页pdf

专知会员服务

107+阅读 · 2021年7月17日

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

专知

9+阅读 · 2022年10月30日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体，176页pdf

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体，176页pdf

专知

4+阅读 · 2022年9月14日

【斯坦福博士论文】具有学习约束的深度表示，239页pdf

【斯坦福博士论文】具有学习约束的深度表示，239页pdf

专知

0+阅读 · 2022年9月13日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【斯坦福博士论文】用于系统设计的图算法，130页pdf

【斯坦福博士论文】用于系统设计的图算法，130页pdf

专知

3+阅读 · 2022年8月22日

高维多媒体特征的低维流形子空间降维及聚类研究

国家自然科学基金

0+阅读 · 2014年12月31日

三维场景理解中的高阶能量优化理论与方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

大型三维网格模型远程绘制的新机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

融合几何信息的多尺度流体动画建模方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向高性能计算的高效平台虚拟化关键技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

Depth-Supervised NeRF for Multi-View RGB-D Operating Room Images

Arxiv

0+阅读 · 2022年11月22日

Factor-guided functional PCA for high-dimensional functional data

Arxiv

0+阅读 · 2022年11月22日

Improving Intrinsic Exploration with Language Abstractions

Arxiv

0+阅读 · 2022年11月21日

Tensor4D : Efficient Neural 4D Decomposition for High-fidelity Dynamic Reconstruction and Rendering

Arxiv

0+阅读 · 2022年11月21日

Decomposing 3D Neuroimaging into 2+1D Processing for Schizophrenia Recognition

Arxiv

0+阅读 · 2022年11月21日

VIP会员

相关主题

三维场景理解

相关VIP内容

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

专知会员服务

45+阅读 · 2022年9月29日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知会员服务

126+阅读 · 2022年9月11日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知会员服务

89+阅读 · 2022年7月11日

【斯坦福博士论文】视觉语言的多模态表示，102页pdf

专知会员服务

73+阅读 · 2021年7月29日

【斯坦福博士论文】深度学习医学图像解译，207页pdf

专知会员服务

107+阅读 · 2021年7月17日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

专知

9+阅读 · 2022年10月30日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体，176页pdf

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体，176页pdf

专知

4+阅读 · 2022年9月14日

【斯坦福博士论文】具有学习约束的深度表示，239页pdf

【斯坦福博士论文】具有学习约束的深度表示，239页pdf

专知

0+阅读 · 2022年9月13日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【斯坦福博士论文】用于系统设计的图算法，130页pdf

【斯坦福博士论文】用于系统设计的图算法，130页pdf

专知

3+阅读 · 2022年8月22日

相关基金

高维多媒体特征的低维流形子空间降维及聚类研究

国家自然科学基金

0+阅读 · 2014年12月31日

三维场景理解中的高阶能量优化理论与方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

大型三维网格模型远程绘制的新机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

融合几何信息的多尺度流体动画建模方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向高性能计算的高效平台虚拟化关键技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

相关论文

Depth-Supervised NeRF for Multi-View RGB-D Operating Room Images

Arxiv

0+阅读 · 2022年11月22日

Factor-guided functional PCA for high-dimensional functional data

Arxiv

0+阅读 · 2022年11月22日

Improving Intrinsic Exploration with Language Abstractions

Arxiv

0+阅读 · 2022年11月21日

Tensor4D : Efficient Neural 4D Decomposition for High-fidelity Dynamic Reconstruction and Rendering

Arxiv

0+阅读 · 2022年11月21日

Decomposing 3D Neuroimaging into 2+1D Processing for Schizophrenia Recognition

Arxiv

0+阅读 · 2022年11月21日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

隐秘的头发

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员