4 月 23 日,CVPR 2022 论文分享会等你准时线上赴约!为了让更多感兴趣的朋友参与到精彩的分享会中,同时响应疫情防控政策,今年的 CVPR 论文分享会将在 B 站“微软中国视频中心”全程进行直播,参与方式详见本文文末。
今年,我们很荣幸邀请到本届 CVPR 会议的程序主席华刚博士为大家带来“你和你的计算机视觉研究生涯”的主旨演讲,华刚博士将分享他对于学术人生的理解,以及作为领域的一份子,如何让自己的职业生涯与计算机视觉这一蓬勃的领域共舞。
论文是研究者工作的集萃,与此同时,做出能加深或改变领域理解和工程实践的工作,也是每位研究者的追求。顶级会议最佳论文就是这样的存在!今年的圆桌论坛将以“好论文是怎么炼成的?”为主题,马毅、屠卓文、戴玉超、张祥雨和黄高这几位历年视觉顶会最佳论文的斩获者,将分享他们对于“做好的论文”和“做好的研究”的理解,共话计算机视觉领域的科研淬炼!
主旨演讲嘉宾
华刚
便利蜂 CTO 兼首席科学家
本届 CVPR 程序主席
华刚博士是便利蜂 CTO 兼首席科学家,IEEE Fellow, IAPR Fellow 和 ACM 杰出科学家。华刚博士是计算机视觉和模式识别国际著名专家,其主要研究方向包括计算机视觉、模式识别、机器学习与机器人;当前的技术实践研究重点是人工智能技术在实体零售数字化决策和运营的应用。华刚博士曾任微软研究院首席研究员、斯蒂文森理工学院副教授、IBM 研究院和诺基亚研究院高级研究员。2015 年因其在图像视频人脸识别所作出的贡献而获得国际模式识别联合会青年生物特征杰出研究员奖。他在国际期刊和顶级会议上发表论文 200 余篇,并拥有 20 多项美国和国际专利,同时还有 20 多项美国和国际专利申请。华刚博士是 2019 年和 2022 年 CVPR 的程序主席,和 2025 年 ICCV 的大会主席, 并且是 T-PAMI 和 IJCV 的现任编委,并曾任 CVIU 的副主编。
演讲主题:你和你的计算机视觉研究生涯
摘要:经过计算机视觉社群数十年的不断努力,计算机视觉技术已经发展到可赋能众多实际应用的阶段。有趣的是,视觉研究人员常常被问到:“计算机视觉的杀手级应用是什么?”即使视觉技术已经逐渐发展、成熟到如今的阶段,这依旧是我们社群必须回答的一个关键问题。在演讲的第一部分,我将尝试从一个较高的层面来回答这个问题,剖析在数字生产力带来的巨大机遇中,计算机视觉所能扮演的重要角色。在演讲的第二部分,我将会介绍我的想法,讨论个人如何探索他自己的计算机视觉研究生涯。特别地,我还会就“为什么计算机视觉对研究人员来说是一个好的社群”来分享我的观察和思考。
圆桌论坛嘉宾
马毅
1999 年 ICCV最佳论文奖得主
2004 年 ECCV 时间检验-荣誉奖
马毅教授是 IEEE Fellow,ACM Fellow,SIAM Fellow,现任加州大学伯克利分校教授。他 1995 年本科毕业于清华大学自动化专业;1997 年获 UCB 电子工程与计算机科学硕士学位;2000 年获 UCB 数学硕士学位和电子工程与计算机科学博士学位。博士毕业后,马毅先在 UIUC 任教,后于 2009 年至 2014 年间任微软亚洲研究院计算机视觉组主任及首席研究员,2014 年后在上海科技大学信息科学与技术学院任教。
研究方向为计算机视觉、高维数据分析、智能系统。是推动 3D 视觉进展的重要学者,其论文 Euclidean Reconstruction and Reprojection up to Subgroups 荣获 1999 年 ICCV 最佳论文奖(马尔奖),其论文 A Unified Algebraic Approach to 2-D and 3-D Motion Segmentation 荣获 2004 年 ECCV 时间检验-荣誉奖。在压缩感知、稀疏低质表达领域发表了一系列经典论文,包括 PAMI2008 上将稀疏表达用于人脸识别的论文等,是该领域的主要发起人和推动者。
1999 年 ICCV 最佳论文:子群下的欧式重构和重投影
摘要:在实践中,能够从一个图像序列中估计场景结构、运动和摄像机校准的充要条件很少得到满足。当这些条件不满足时,在具有实际重要性的序列中究竟可以估计出什么?在本文中,我们对这个问题给出了一个完整的答案,所有结果都使用简单的符号呈现,不涉及张量,也不涉及复杂的射影几何,并且只需有线性代数基础就能理解。
屠卓文
2003 年 ICCV 最佳论文得主
2015 年 ICCV 最佳论文-荣誉奖
加州大学圣地亚哥分校认知科学系 (联属计算机科学与工程系)教授,IEEE Fellow。曾任教于加州大学洛杉矶分校,2011 初年至 2012 年底间在微软亚洲研究院工作。在俄亥俄州立大学获得博士学位,在清华大学获得硕士学位。
发表过的系列重要的工作包括:早期的如 DDMCMC, Image Parsing, PBT, Auto-Context,ChnFtrs 近期的如DSN, HED, ResNeXt, 以及 GDL (CVPR 2007)的对抗式生成模型(能量模式)等等。Image Parsing论文荣获 2003 年 ICCV 最佳论文奖(马尔奖),HED 荣获 2015 年 ICCV 最佳论文提名奖 (马尔奖-荣誉奖)。
2015 年 ICCV 最佳论文-荣誉奖:整体嵌套边缘检测(HED)
摘要:在 AISTATS 2015 论文中,通过将直接监督引入中间层,我们开发了一种新的深度学习框架 DSN。DSN 缓解了深度卷积神经网络中梯度消失/爆炸的问题,让中间层的特征学习直接接受数据反馈,并显著提高了分类器的泛化能力。DSN 在深度学习社区中得到了迅速采用。进一步将 DSN 深度监督的想法引入计算机视觉,整体嵌套边缘检测 (HED, ICCV 2015) 是通过解决长期存在的边缘检测问题中的两个关键问题而开发的:(1)整体图像训练和预测;(2) 多尺度、多层次的特征学习。HED 通过对侧面响应的深度监督自动学习丰富的层次表示。它显著提升了边缘检测的效果和速度,成为至此以后的边缘检查的经典算法。
戴玉超
2012 年 CVPR 最佳论文得主
教授、博士生导师,是国家级青年人才,院长助理,陕西省信息获取与处理重点实验室主任及国际联合研究中心副主任。于 2005 年、2008 年和 2012 年分别获得西北工业大学学士、硕士和博士学位。2012 年至 2014 年在澳大利亚国立大学从事博士后研究工作,2014 年至 2017 年在澳大利亚国立大学工程研究院担任 ARC DECRA 学者。担任 CVPR、ICCV、ACM-MM 等国际顶级会议领域主席。
主要研究方向涵盖底层视觉的众多问题,包括智能视觉感知、三维场景重建、多视角几何、显著性检测、无人驾驶等。关于 3D 重构论文荣获 CVPR 2012 最佳论文奖(大陆高校首次),关于 RGB-D 显著性检测论文荣获 CVPR 2020 最佳论文奖提名。
2012 年 CVPR 最佳论文:一种简单的用于非刚性运动恢复结构分解的无需先验方法
摘要:本文提出了一种简单的“无需先验”方法来求解非刚性运动恢复结构(NRSfM)分解问题。与使用基本的低阶线性组合模型假设不同,我们的方法不假设任何关于非刚性结构或相机运动的额外先验知识。然而,它非常有效且可靠,得到了最佳结果,并且不会受到困扰大多数传统 NRSfM 因子分解方法的固有基础模糊性问题的影响。这项工作不仅提供了新的理论见解,而且还为 NRSfM 提供了一个简单实用的日常解决方案。
张祥雨
2016 年 CVPR 最佳论文得主
2017 年博士毕业于西安交通大学,期间参加微软亚洲研究院联合培养博士生项目,师从孙剑博士和何恺明博士。研究方向包括深度卷积网络设计,深度模型的裁剪与加速等。曾在 CVPR/ ICCV/ ECCV/ NeurIPS/ ICLR/ TPAMI 等顶级会议期刊上发表论文四十余篇,并多次获得顶级视觉竞赛如 ImageNet/ COCO 冠军。入选福布斯中国 U30 和 AI 2000 计算机视觉全球最具影响力学者榜单,以及智源青年科学家。
代表作包括业界广泛使用的神经网络架构 ResNets/ ShuffleNets/ RepVGG 系列,神经网络架构搜索算法 SPOS,模型压缩裁剪算法 CP/ MetaPruning 等,其中 ResNet 获 CVPR 2016 最佳论文奖。Google Scholar 引用数 150,000+。
2016 年 CVPR 最佳论文:用于图像识别的深度残差学习 ResNet
摘要:对于许多视觉识别任务来说,表示的深度至关重要。仅靠极深的表示,我们在 COCO 物体检测数据集上取得了 28%的相对提升。深度残差网络是我们参加 ILSVRC & COCO 2015 比赛的基础模型,在该竞赛中,我们还在 ImageNet 检测、ImageNet 定位、COCO 检测和 COCO 分割任务中获得了第一名。
黄高
2017 年 CVPR 最佳论文得主
清华大学自动化系副教授,博士生导师。获国家优青、达摩院青橙奖、世界人工智能大会 SAIL 先锋奖、中国百篇最具影响国际学术论文和中国人工智能学会自然科学一等奖等荣誉,入选 MIT TR35(亚太区)、北京智源学者、AI 2000 人工智能最具影响力学者。目前在 NeurIPS,ICML,CVPR 等国际顶级会议和期刊发表学术论文 70 余篇,被引 30000 余次,最高单篇引用超过 2 万次。
研究方向为神经网络结构设计,特别是动态神经网络和高效深度学习方法。其论文 DenseNet 荣获 2017 年 CVPR 最佳论文奖,是视觉的主流基本网络架构。还发表过多篇广受关注的工作,包括目前广泛使用的 Stochastc Depth (Drop Path)正则训练方法,SnapShot 集成方法等 ,是动态神经网络这一研究方向的主要推动者之一。
2017 年 CVPR 最佳论文:密集连接卷积网络
摘要:最近的研究表明,如果卷积网络在靠近输入的层和靠近输出的层之间包含较短的连接,那么卷积网络可以更深,更准确,更高效地进行训练。在本文中,我们基于这一观察进一步拓展,提出密集连接卷积网络(DenseNet),它将网络的每一层连接到随后的所有层。DenseNet 有几个引人注目的优势:缓解了梯度消失的问题,加强了特征传播,鼓励特征重用,并大大减少了参数数量。与大多数最先进的网络相比,DenseNet 取得了显著的提升,同时可以通过更少的计算来实现更高的性能。
日程安排
参与与互动方式
为了让更多感兴趣的朋友参与到精彩的分享会中,同时响应疫情防控政策,今年的 CVPR 论文分享会将在 B 站“微软中国视频中心”全程进行直播。敬请保持关注!
B 站直播间:https://live.bilibili.com/730
此外,所有论文将在论文分享平台 ReadPaper 上进行展示,我们鼓励大家可以在会前阅读论文,锁定感兴趣的方向,提前准备问题。
ReadPaper 链接:https://readpaper.com/activity/cvpr2022
公众号后台回复“CVPR2022”获取论文分类合集下载~
# CV技术社群邀请函 #
备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)
即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群
每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~