In this work, we present an effective multi-view approach to closed-loop end-to-end learning of precise manipulation tasks that are 3D in nature. Our method learns to accomplish these tasks using multiple statically placed but uncalibrated RGB camera views without building an explicit 3D representation such as a pointcloud or voxel grid. This multi-camera approach achieves superior task performance on difficult stacking and insertion tasks compared to single-view baselines. Single view robotic agents struggle from occlusion and challenges in estimating relative poses between points of interest. While full 3D scene representations (voxels or pointclouds) are obtainable from registered output of multiple depth sensors, several challenges complicate operating off such explicit 3D representations. These challenges include imperfect camera calibration, poor depth maps due to object properties such as reflective surfaces, and slower inference speeds over 3D representations compared to 2D images. Our use of static but uncalibrated cameras does not require camera-robot or camera-camera calibration making the proposed approach easy to setup and our use of \textit{sensor dropout} during training makes it resilient to the loss of camera-views after deployment.


翻译:在这项工作中,我们展示了一种有效的多视角方法,以封闭环端端到端端学习3D性质的精确操作任务。我们的方法是学习使用多个静态定位但未经校正的 RGB 相机视图完成这些任务,而没有建立清晰的 3D 代表器,例如点球或 voxel 网格。这种多相机方法在与单一视图基线相比的困难堆叠和插入任务上取得了优异的任务性能。单一视图机器人代理器在隔离上挣扎,在估计感兴趣的点之间的相对代表面时遇到挑战。虽然从多个深度传感器的注册输出中可以获取完整的 3D 场面演示( voxels 或 pointclouds),但一些挑战使得在这种明确的 3D 显示器上操作复杂化。 这些挑战包括摄影机的不完善校准校正、 诸如反射面等物体特性的深度图差,以及比 2D 图像的3D 更慢的摄像速度。我们使用静但未经校准的相机不需要相机或相机校准,因此建议的方法容易安装和我们使用相机之后的相机。

0
下载
关闭预览

相关内容

专知会员服务
15+阅读 · 2021年4月3日
专知会员服务
41+阅读 · 2021年4月2日
【阿里巴巴-CVPR2020】频域学习,Learning in the Frequency Domain
专知会员服务
109+阅读 · 2020年3月12日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
59+阅读 · 2019年10月17日
ICRA 2019 论文速览 | 基于Deep Learning 的SLAM
计算机视觉life
41+阅读 · 2019年7月22日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
【泡泡一分钟】点云到网格的回归算法实现
泡泡机器人SLAM
8+阅读 · 2018年11月23日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Arxiv
14+阅读 · 2021年3月10日
3D-LaneNet: end-to-end 3D multiple lane detection
Arxiv
7+阅读 · 2018年11月26日
VIP会员
相关资讯
ICRA 2019 论文速览 | 基于Deep Learning 的SLAM
计算机视觉life
41+阅读 · 2019年7月22日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
【泡泡一分钟】点云到网格的回归算法实现
泡泡机器人SLAM
8+阅读 · 2018年11月23日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Top
微信扫码咨询专知VIP会员