报告题目:
Bringing Robots to the Computer Vision Community
报告简介:
视觉界对机器人的兴趣高涨。最近在CVPR/ICCV/ECCV上发表的一些论文涉及机器人学问题:移动导航、操纵和导航的视觉伺服、视觉抓取/推送、定位、具体视觉问答、视觉和语言导航、移动模拟器。许多论文研究如何有效地研究机器人视觉学习的数据。研究还侧重于学习提供的视频分析。积极的愿景也越来越受欢迎。虽然这些作品展示了令人印象深刻的成果,但大多数作品都回避在真正的机器人上展示成果,可能是因为社区缺乏专业知识,无法进入机器人平台,甚至只是害怕处理机器人硬件。这限制了这些工作的影响,因为机器人社区通常只相信在物理平台上成功部署的结果(有充分的理由)。此外,抽象出物理系统,也消除了重要而有趣的研究挑战。因此,接触物理机器人可以引导实践者朝着更有成效的研究方向前进,并导致更具影响力的工作。本教程的目标是填补这一专业知识的空白,并为感兴趣的参与者提供基本工具,这些工具对构建、编程和操作机器人非常有用。我们将专注于社区中流行的用例,并使用一个运行在具有移动基础的开源低成本操纵器上的示例。我们相信,这种专业知识将使计算机视觉研究人员能够更好地理解真实机器人的感知问题,在真实世界的真实系统上演示他们的算法,并使研究更容易在视觉和机器人社区之间进行转换。
嘉宾介绍:
Sergey Levine,是加州大学伯克利分校电子工程与计算机科学系的助理教授。在我的研究中,我将重点放在控制和机器学习之间的交叉点上,目的是开发算法和技术,使机器能够自主地获得执行复杂任务的技能。特别是,我感兴趣的是如何利用学习来获得复杂的行为技能,从而赋予机器更大的自主性和智能性。
Katerina Fragkiadaki, 是卡内基梅隆大学机器学习系的助理教授。在加入MLD的教员之前,花了三年时间作为博士后研究员,首先在加州大学伯克利分校(UC Berkeley)与Jitendra Malik合作,然后在谷歌山景研究院(Google Research in Mountain View)与视频组合作。完成了我的博士学位掌握,与石剑波。