Reflective and textureless surfaces such as windows, mirrors, and walls can be a challenge for object and scene reconstruction. These surfaces are often poorly reconstructed and filled with depth discontinuities and holes, making it difficult to cohesively reconstruct scenes that contain these planar discontinuities. We propose Echoreconstruction, an audio-visual method that uses the reflections of sound to aid in geometry and audio reconstruction for virtual conferencing, teleimmersion, and other AR/VR experience. The mobile phone prototype emits pulsed audio, while recording video for RGB-based 3D reconstruction and audio-visual classification. Reflected sound and images from the video are input into our audio (EchoCNN-A) and audio-visual (EchoCNN-AV) convolutional neural networks for surface and sound source detection, depth estimation, and material classification. The inferences from these classifications enhance scene 3D reconstructions containing open spaces and reflective surfaces by depth filtering, inpainting, and placement of unmixed sound sources in the scene. Our prototype, VR demo, and experimental results from real-world and virtual scenes with challenging surfaces and sound indicate high success rates on classification of material, depth estimation, and closed/open surfaces, leading to considerable visual and audio improvement in 3D scenes (see Figure 1).


翻译:窗体、镜像和墙壁等反射和无纹表面的表面,如窗体、镜像和墙壁等,可能成为物体和场面重建的挑战。这些表面的重建往往不善,而且充满了深度不连续和洞洞,因此难以以一致的方式重建含有这些平板不连续的场景。我们提议了Echorebuilt,这是一个视听方法,利用声音的反射,帮助为虚拟会议、遥视和其他AR/VR经验进行声学和音频重建,进行几何和音频重建。移动电话原型发出脉冲音频,同时为基于 RGB 的 3D 重建和视听分类录下视频。视频的反射声音和图像被输入到我们的音频(EchoCN-A)和视听(EchoCNN-AV) 中,难以以一致的方式重建含有这些平面和声波源检测、深度估计的声波重建。这些分类的推论通过深度过滤、平面、平面图像的原样、VR demo化和实验性结果,显示在现实和图像的高度的深度上,以及地面上,显示具有挑战性的表面和视觉的图像的成像的图像的成像率和图像的成功率和图像,显示了相当的成像和图像的成。

0
下载
关闭预览

相关内容

Surface 是微软公司( Microsoft)旗下一系列使用 Windows 10(早期为 Windows 8.X)操作系统的电脑产品,目前有 Surface、Surface Pro 和 Surface Book 三个系列。 2012 年 6 月 18 日,初代 Surface Pro/RT 由时任微软 CEO 史蒂夫·鲍尔默发布于在洛杉矶举行的记者会,2012 年 10 月 26 日上市销售。
【硬核书】终身机器学习,145页pdf
专知会员服务
82+阅读 · 2021年3月1日
专知会员服务
109+阅读 · 2020年3月12日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
“CVPR 2020 接受论文列表 1470篇论文都在这了
三维重建 3D reconstruction 有哪些实用算法?
极市平台
12+阅读 · 2020年2月23日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
【泡泡一分钟】基于视频修复的时空转换网络
泡泡机器人SLAM
5+阅读 · 2018年12月30日
【ECCV2018】24篇论文代码实现
专知
17+阅读 · 2018年9月10日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
Arxiv
0+阅读 · 2021年11月30日
Arxiv
1+阅读 · 2021年11月30日
VIP会员
Top
微信扫码咨询专知VIP会员