分享主题
DeepIM: 基于单张RGB图像的物体姿态估计
分享背景
物体姿态估计在机器人领域(如机械臂抓取)、AR/VR领域、无人驾驶领域有着广泛的应用,在物体跟踪、建模等相关领域也有着重要的影响。任务提供物体三维模型和一张RGB(D)图像,要求精确估计该物体在图像中的位置。虽然RGB相机有着广视角,高分辨率,可以室外工作等一系列优点,可是由于缺少强大的基于RGB图像的姿态优化方法,基于RGB图像的在该任务上的精度远低于基于RGB-D图像的方法。本工作提出了一个解决方案,能大幅度提升RGB图像上物体姿态估计的精度,多个指标追平乃至超越基于RGB-D图像的方法的结果。
分享嘉宾
李益,华盛顿大学博士在读,本科硕士毕业于清华大学,COCO2016冠军,R-FCN, FCIS, Deformable-Conv作者。
分享提纲
1. 任务背景介绍:什么是物体姿态估计,以及为什么要在RGB图像上进行相关研究
2. 网络整体框架:迭代更新估计结果并重新预测残差
3. 关键点:如何设计合理的representation来表示预测结果
4. ablation study & results:各个设计的原因和思考,和其他方法的比较
5. 扩展探究:在未见过的物体上也能有效
分享时间
(北京时间)11月7日(周三) 下午3点
直播链接
http://www.mooc.ai/open/course/592
想了解更多 AI 研习社直播?
欢迎点击“阅读原文”
或者移步 AI 研习社社区~
全球AI+智适应教育峰会
免费门票开放申请!
雷锋网联合乂学教育松鼠AI以及IEEE教育工程和自适应教育标准工作组,于11月15日在北京嘉里中心举办全球AI+智适应教育峰会。美国三院院士、机器学习泰斗Michael Jordan、机器学习之父Tom Mitchell已确认出席,带你揭秘AI智适应教育的现在和未来。
扫码免费注册