AI 研习社按:机器学习、人工智能领域的研究人员,以及任何学术研究人员,都关心这两件事:分享、传播自己的研究成果让更多人知道,以及了解自己研究方向的最新进展、结识更多的研究人员。雷锋网 AI 研习社大讲堂就是一个供研究人员们分享自己成果、促进广泛沟通互动的直播平台。
自 AI 大讲堂去年 7 月上线以来, 已经有来自清华大学、北京大学、上海交通大学、香港科技大学、 MIT、UC Berkeley、悉尼科技大学等知名国内外高校的嘉宾进行直播分享,甚至还举办了线下论文分享会,迄今已完成了 68 期,覆盖影响读者过万人。不仅嘉宾自己的研究成果被直播观众以及读者们了解,也让科技爱好者们、学生们、其它研究人员们增进了对人工智能相关思维、知识、应用的认识,为国内人工智能长期持续发展的氛围出一份力。
人工智能相关的各个研究方向中,最为丰富也最为热门的当属计算机视觉(CV)了,其中的热门任务包括图像分类、对象检测、图像分割、图像生成、图像描述生成等等。下面我们汇总了近期(2018 年以来)9 期精彩的计算机视觉方向分享回顾。
第 45 期,图像分割的经典算法。
http://www.mooc.ai/open/course/414
分享嘉宾:刘汉唐,浙江大学计算机系博士生。
图像分割是计算机视觉中一个经典并且基础的问题,对于理解图像非常关键。图像分割有很多应用场景,比如无人驾驶、地图重建、图像美化等等。深度学习使得图像分割有了巨大的发展,本次分享会介绍深度学习中图像分割的经典算法。
第 50 期,基于强化学习的时间行为检测自适应模型。
http://www.mooc.ai/open/course/459
分享嘉宾:黄靖佳,北京大学深圳研究生院信息工程学院二年级博士生。
视频中的行为检测是当下的热点研究任务,该任务要求从一段未经修剪的(untrimmed)视频中找出目标行为发生的时间区间。由于目标行为可能发生的时间点以及目标行为的持续时间均是不确定的,使得在完成这项任务时往往需要花费大量的计算资源对不同时间尺度(长度),不同起点的视频片段进行判断。为了避免这种低效的检测方法,我们提出了一种可以自适应调整检测窗口大小及位置的方法,对视频进行高效的检测。
第 58 期,基于课程学习的强化多标签图像分类算法。
http://www.mooc.ai/open/course/499
分享嘉宾:何诗怡,北京大学计算机视觉硕士,优必选悉尼AI研究院学生。
与单标签图像分类相比,多标签图像分类是一种更符合真实世界客观规律的方法,尤其在图像和视频的语义标注,基于内容的图像检索等领域有着广泛的应用。因此,本次公开课,何诗怡将分享她用强化学习解决多标签图像分类问题的方法和经验
第 59 期,深度学习在点云分割中的应用。
http://www.mooc.ai/open/course/505
分享嘉宾:王薇月,南加州大学计算机系在读博士。
随着激光雷达,RGBD相机等3D传感器在机器人,无人驾驶领域的广泛应用,深度学习在三维点云数据的研究在近两年取得了广泛关注。点云分割、识别、检测成为学术界、工业界的热门话题之一。是在本次公开课中,讲者将分享其关于点云分割的最新工作。
第 60 期,基于残差密集网络的图像超分辨率 (CVPR 2018 亮点论文)。
http://www.mooc.ai/open/course/505
分享嘉宾:张宇伦,美国东北大学计算机工程在读博士,Adobe 公司深度学习研究实习生
图像超分辨率技术作为底层计算机视觉任务,有着广泛的应用场景,比如:手机图像增强,视频监控,医疗影像,卫星图像,低分辨率人脸识别。因此,图像超分辨率技术吸引了众多来自学术界与工业界的研究兴趣。但是,当前图像超分辨率技术仍然面临一些难题,比如,对高放大倍数的图像超分辨,难以恢复丢失的细节;对已经恢复出的细节,也有着模糊等效应,其质量有待提升。因此,本次公开课,张宇伦同学设计一种新的网络结构,得到更强的表达能力,不仅将之前方法难以恢复的细节恢复出来了,而且,结果更清晰。最终,在不同图像退化模型下都达到了当前较好的结果。
第 61 期,网格曲面的神经网络 (CVPR 2018 oral: Surface Networks)。
http://www.mooc.ai/open/course/510
分享嘉宾:姜仲石,纽约大学科朗数学研究所(NYU Courant) 二年级博士生。
网格是几何数据的常用高效表示, 在几何曲面构建的机器学习方法对计算机图形学,3D计算机视觉以及几何分析和处理有着重要的意义。
第 63 期,任中正:利用合成数据的跨领域的多任务视觉特征学习。
http://www.mooc.ai/open/course/521
分享嘉宾:任中正,现UIUC攻读计算机博士。
现在的神经网络可以通过监督学习学到很好的迁移学习本领,然而却需要百万级别的手工标注数据。自监督(self-supervised)任务就是一种为了取代标注数据的方式。 然而已有的自监督方法大部分是单任务,导致模型容易在这个任务上过拟合。任博士分享了用合成数据做多任务特征学习的工作,以及如何使用domain adaptation来让学到的特征更好的迁移到真实世界的视觉任务上。
第 64 期,Direction-aware Spatial Context Features for Shadow Detection。
http://www.mooc.ai/open/course/523
分享嘉宾:胡枭玮,香港中文大学二年级博士生。
阴影检测是计算机视觉中基础并富有挑战性的问题。检测阴影区域,为进一步获取图像中的光照情况、物体的形状与位置,以及摄像机的参数提供了可能,同时阴影的存在为目标的检测与跟踪带来了障碍。检测阴影区域需要理解图像全局的语义信息,本文提出通过方向性地分析图像空间上下文信息来理解阴影,同时设计了DSC模型用于检测、去除阴影,并在两个阴影检测数据集以及两个阴影去除数据集上都达到了顶尖的性能。这篇论文已被CVPR 2018收录,并做口头报告(Oral)。
第 68 期,室内场景的结构化重建。
http://www.mooc.ai/open/course/538
分享嘉宾:刘晨,圣路易斯华盛顿大学计算机系在读博士。
随着增强现实,家务机器人等应用的普及,室内场景重建研究正在得到越来越广泛的关注。与传统底层密集重建方法不同,讲者的研究集中在分析重建场景中的高层结构化信息。在本次公开课中,讲者将分享其结构化重建的最新工作。
大讲堂系列直播分享持续进行中。更多精彩研究成果分享、更多往期内容汇总,请继续关注我们。