题目: Visual Recognition and Beyond
报告简介: 本教程涵盖了视觉识别研究前沿的主题。 我们将讨论来自图像和视频的实例级识别的最新进展,详细介绍视觉识别任务系列中的最新工作。 讲座涵盖了图像分类,视频分类,对象检测,动作检测,实例分割,语义分割,全景分割和姿势估计背后的方法和原理。
报告目录:
嘉宾介绍:
Ross Girshick,是Facebook人工智能研究(FAIR)的一名研究科学家,致力于计算机视觉和机器学习。2012年,他在Pedro Felzenszwalb的指导下获得了芝加哥大学的计算机科学博士学位。加入FAIR之前,罗斯曾在微软研究院(Microsoft Research)、雷德蒙(Redmond)和加州大学伯克利分校(University of California, Berkeley)做研究员,他的兴趣包括实例级别的对象理解和将自然语言处理与计算机视觉相结合的视觉推理挑战。他获得了2017年PAMI青年研究员奖,并以开发R-CNN(基于区域的卷积神经网络)方法来检测对象而闻名。2017年,还凭借《面具R-CNN》在ICCV获得马尔奖。
Justin Johnson,斯坦福大学博士,导师是计算机视觉领域顶级学者李飞飞博士。研究兴趣包括计算机视觉和机器学习方面,涉及到视觉推理、视觉和语言,以及使用深层神经网络生成图像。Johnson目前是Facebook AI Research的研究科学家。从2019年秋季开始,我将加入密歇根大学计算机科学与工程专业,担任助理教授。Johnson在2018年夏天完成博士学位,其博士论文组成式视觉智能《Compositional visual intelligence》,195页详述采用组合式学习的方法对计算机视觉中图像描述、视觉问答、文本图像生成三方面的问题进行了研究,是组合式视觉智能的代表性研究工作。