4月23日,微软亚洲研究院CVPR论文分享会与你相约!
想学习计算机视觉领域最前沿的研究成果?想与论文作者直接交流,探讨科研设想的实现路径?一年一度的CVPR论文分享会正是为你而准备!
为了促进计算机视觉领域前沿研究的分享与交流,推动相关技术进步与发展,微软智能信息处理西安交通大学实验室与微软亚洲研究院将于4月23日联合主办CVPR 2022论文分享会。国际计算机视觉与模式识别会议(CVPR)是人工智能领域最有学术影响力的顶级会议之一,计算机视觉领域的顶尖学者、研究人员将通过本活动为大家带来一场论文分享盛宴。
此外,为了让更多感兴趣的朋友参与到精彩的分享会中,同时响应疫情防控政策,今年的CVPR论文分享会将在B站“微软中国视频中心”全程进行直播,详见本文参与方式部分。
本次活动由CCF计算机视觉专委会、中国图象图形学会视觉大数据专委会、CCF女计算机工作者委员会、中国图象图形学会女科技工作者工作委员会协办。
✦
日程安排
✦
✦
参与方式
✦
为了让更多感兴趣的朋友参与到精彩的分享会中,同时响应疫情防控政策,今年的CVPR论文分享会将在B站“微软中国视频中心”全程进行直播。
B站直播间:https://live.bilibili.com/730
我们也将通过微博图文转播、微信观众群为大家提供更多互动渠道,带领大家体验沉浸式参会。欢迎大家在微信群中提问,你的问题将有机会被论文作者pick,在分享会中专门进行解答。
微信观众群:
此外,所有论文将在论文分享平台ReadPaper上进行展示,我们鼓励大家可以在会前阅读论文,锁定感兴趣的方向,提前准备问题。
ReadPaper链接:
https://readpaper.com/activity/cvpr2022
✦
亮点一:主旨演讲
✦
今年,我们很荣幸邀请到本届CVPR会议的程序主席华刚博士为大家带来“你和你的计算机视觉研究生涯”的主旨演讲,华刚博士将分享他对于学术人生的理解,以及作为领域的一份子,如何让自己的职业生涯与计算机视觉这一蓬勃的领域共舞。
华刚
便利蜂CTO兼首席科学家
本届CVPR程序主席
华刚博士是便利蜂CTO兼首席科学家,IEEE Fellow, IAPR Fellow 和 ACM 杰出科学家。华刚博士是计算机视觉和模式识别国际著名专家,其主要研究方向包括计算机视觉、模式识别、机器学习与机器人;当前的技术实践研究重点是人工智能技术在实体零售数字化决策和运营的应用。华刚博士曾任微软研究院首席研究员、斯蒂文森理工学院副教授、IBM 研究院和诺基亚研究院高级研究员。2015 年因其在图像视频人脸识别所作出的贡献而获得国际模式识别联合会青年生物特征杰出研究员奖。他在国际期刊和顶级会议上发表论文 200 余篇,并拥有 20 多项美国和国际专利,同时还有 20 多项美国和国际专利申请。华刚博士是 2019 年和 2022 年 CVPR 的程序主席,和 2025 年 ICCV 的大会主席, 并且是 T-PAMI 和 IJCV 的现任编委,并曾任 CVIU 的副主编。
演讲主题:你和你的计算机视觉研究生涯
摘要:经过计算机视觉社群数十年的不断努力,计算机视觉技术已经发展到可赋能众多实际应用的阶段。有趣的是,视觉研究人员常常被问到:“计算机视觉的杀手级应用是什么?”即使视觉技术已经逐渐发展、成熟到如今的阶段,这依旧是我们社群必须回答的一个关键问题。在演讲的第一部分,我将尝试从一个较高的层面来回答这个问题,剖析在数字生产力带来的巨大机遇中,计算机视觉所能扮演的重要角色。在演讲的第二部分,我将会介绍我的想法,讨论个人如何探索他自己的计算机视觉研究生涯。特别地,我还会就“为什么计算机视觉对研究人员来说是一个好的社群”来分享我的观察和思考。
✦
亮点二:圆桌论坛
✦
论文是研究者工作的集萃,与此同时,做出能加深或改变领域理解和工程实践的工作,也是每位研究者的追求。顶级会议最佳论文就是这样的存在!今年的圆桌论坛将以“好论文是怎么炼成的?”为主题,马毅、屠卓文、戴玉超、张祥雨和黄高这几位历年视觉顶会最佳论文的斩获者,将分享他们对于“做好的论文”和“做好的研究”的理解,共话计算机视觉领域的科研淬炼!
马毅
1999 年 ICCV最佳论文奖得主
2004 年 ECCV 时间检验-荣誉奖
马毅教授是 IEEE Fellow,ACM Fellow,SIAM Fellow,现任加州大学伯克利分校教授。他 1995 年本科毕业于清华大学自动化专业;1997 年获 UCB 电子工程与计算机科学硕士学位;2000 年获 UCB 数学硕士学位和电子工程与计算机科学博士学位。博士毕业后,马毅先在 UIUC 任教,后于 2009 年至 2014 年间任微软亚洲研究院计算机视觉组主任及首席研究员,2014 年后在上海科技大学信息科学与技术学院任教。
研究方向为计算机视觉、高维数据分析、智能系统。是推动 3D 视觉进展的重要学者,其论文 Euclidean Reconstruction and Reprojection up to Subgroups 荣获 1999 年 ICCV 最佳论文奖(马尔奖),其论文 A Unified Algebraic Approach to 2-D and 3-D Motion Segmentation 荣获 2004 年 ECCV 时间检验-荣誉奖。在压缩感知、稀疏低质表达领域发表了一系列经典论文,包括 PAMI2008 上将稀疏表达用于人脸识别的论文等,是该领域的主要发起人和推动者。
1999 年 ICCV 最佳论文:子群下的欧式重构和重投影
摘要:在实践中,能够从一个图像序列中估计场景结构、运动和摄像机校准的充要条件很少得到满足。当这些条件不满足时,在具有实际重要性的序列中究竟可以估计出什么?在本文中,我们对这个问题给出了一个完整的答案,所有结果都使用简单的符号呈现,不涉及张量,也不涉及复杂的射影几何,并且只需有线性代数基础就能理解。
屠卓文
2003 年 ICCV 最佳论文得主
2015 年 ICCV 最佳论文-荣誉奖
加州大学圣地亚哥分校认知科学系 (联属计算机科学与工程系)教授,IEEE Fellow。曾任教于加州大学洛杉矶分校,2011 初年至 2012 年底间在微软亚洲研究院工作。在俄亥俄州立大学获得博士学位,在清华大学获得硕士学位。
发表过的系列重要的工作包括:早期的如 DDMCMC, Image Parsing, PBT, Auto-Context,ChnFtrs 近期的如DSN, HED, ResNeXt, 以及 GDL (CVPR 2007)的对抗式生成模型(能量模式)等等。Image Parsing论文荣获 2003 年 ICCV 最佳论文奖(马尔奖),HED 荣获 2015 年 ICCV 最佳论文提名奖 (马尔奖-荣誉奖)。
2015 年 ICCV 最佳论文-荣誉奖:整体嵌套边缘检测(HED)
摘要:在 AISTATS 2015 论文中,通过将直接监督引入中间层,我们开发了一种新的深度学习框架 DSN。DSN 缓解了深度卷积神经网络中梯度消失/爆炸的问题,让中间层的特征学习直接接受数据反馈,并显著提高了分类器的泛化能力。DSN 在深度学习社区中得到了迅速采用。进一步将 DSN 深度监督的想法引入计算机视觉,整体嵌套边缘检测 (HED, ICCV 2015) 是通过解决长期存在的边缘检测问题中的两个关键问题而开发的:(1)整体图像训练和预测;(2) 多尺度、多层次的特征学习。HED 通过对侧面响应的深度监督自动学习丰富的层次表示。它显著提升了边缘检测的效果和速度,成为至此以后的边缘检查的经典算法。
戴玉超
2012 年 CVPR 最佳论文得主
教授、博士生导师,是国家级青年人才,院长助理,陕西省信息获取与处理重点实验室主任及国际联合研究中心副主任。于 2005 年、2008 年和 2012 年分别获得西北工业大学学士、硕士和博士学位。2012 年至 2014 年在澳大利亚国立大学从事博士后研究工作,2014 年至 2017 年在澳大利亚国立大学工程研究院担任 ARC DECRA 学者。担任 CVPR、ICCV、ACM-MM 等国际顶级会议领域主席。
主要研究方向涵盖底层视觉的众多问题,包括智能视觉感知、三维场景重建、多视角几何、显著性检测、无人驾驶等。关于 3D 重构论文荣获 CVPR 2012 最佳论文奖(大陆高校首次),关于 RGB-D 显著性检测论文荣获 CVPR 2020 最佳论文奖提名。
2012 年 CVPR 最佳论文:一种简单的用于非刚性运动恢复结构分解的无需先验方法
摘要:本文提出了一种简单的“无需先验”方法来求解非刚性运动恢复结构(NRSfM)分解问题。与使用基本的低阶线性组合模型假设不同,我们的方法不假设任何关于非刚性结构或相机运动的额外先验知识。然而,它非常有效且可靠,得到了最佳结果,并且不会受到困扰大多数传统 NRSfM 因子分解方法的固有基础模糊性问题的影响。这项工作不仅提供了新的理论见解,而且还为 NRSfM 提供了一个简单实用的日常解决方案。
张祥雨
2016 年 CVPR 最佳论文得主
2017 年博士毕业于西安交通大学,期间参加微软亚洲研究院联合培养博士生项目,师从孙剑博士和何恺明博士。研究方向包括深度卷积网络设计,深度模型的裁剪与加速等。曾在 CVPR/ ICCV/ ECCV/ NeurIPS/ ICLR/ TPAMI 等顶级会议期刊上发表论文四十余篇,并多次获得顶级视觉竞赛如 ImageNet/ COCO 冠军。入选福布斯中国 U30 和 AI 2000 计算机视觉全球最具影响力学者榜单,以及智源青年科学家。
代表作包括业界广泛使用的神经网络架构 ResNets/ ShuffleNets/ RepVGG 系列,神经网络架构搜索算法 SPOS,模型压缩裁剪算法 CP/ MetaPruning 等,其中 ResNet 获 CVPR 2016 最佳论文奖。Google Scholar 引用数 150,000+。
2016 年 CVPR 最佳论文:用于图像识别的深度残差学习 ResNet
摘要:对于许多视觉识别任务来说,表示的深度至关重要。仅靠极深的表示,我们在 COCO 物体检测数据集上取得了 28%的相对提升。深度残差网络是我们参加 ILSVRC & COCO 2015 比赛的基础模型,在该竞赛中,我们还在 ImageNet 检测、ImageNet 定位、COCO 检测和 COCO 分割任务中获得了第一名。
黄高
2017 年 CVPR 最佳论文得主
清华大学自动化系副教授,博士生导师。获国家优青、达摩院青橙奖、世界人工智能大会 SAIL 先锋奖、中国百篇最具影响国际学术论文和中国人工智能学会自然科学一等奖等荣誉,入选 MIT TR35(亚太区)、北京智源学者、AI 2000 人工智能最具影响力学者。目前在 NeurIPS,ICML,CVPR 等国际顶级会议和期刊发表学术论文 70 余篇,被引 30000 余次,最高单篇引用超过 2 万次。
研究方向为神经网络结构设计,特别是动态神经网络和高效深度学习方法。其论文 DenseNet 荣获 2017 年 CVPR 最佳论文奖,是视觉的主流基本网络架构。还发表过多篇广受关注的工作,包括目前广泛使用的 Stochastc Depth (Drop Path)正则训练方法,SnapShot 集成方法等 ,是动态神经网络这一研究方向的主要推动者之一。
2017 年 CVPR 最佳论文:密集连接卷积网络
摘要:最近的研究表明,如果卷积网络在靠近输入的层和靠近输出的层之间包含较短的连接,那么卷积网络可以更深,更准确,更高效地进行训练。在本文中,我们基于这一观察进一步拓展,提出密集连接卷积网络(DenseNet),它将网络的每一层连接到随后的所有层。DenseNet 有几个引人注目的优势:缓解了梯度消失的问题,加强了特征传播,鼓励特征重用,并大大减少了参数数量。与大多数最先进的网络相比,DenseNet 取得了显著的提升,同时可以通过更少的计算来实现更高的性能。
✦
亮点三:六大主题与讲者
✦
20余位讲者将围绕网络结构、自监督+多模态预训练等六大主题,分享他们在CVPR上发表的最新成果。每个主题的论文分享后,今年还首次设置了主题讨论环节,讲者们将就该方向进行针对性讨论,从而带你洞察整个计算机视觉领域的现状与未来!此外,今年新增学生海报展示,我们将精选学生海报在午间时段直播,敬请期待!
一、网络结构
主持人:鲁继文
清华大学自动化系长聘副教授,博士生导师,国家杰出青年科学基金获得者
黄高
清华大学自动化系副教授,博士生导师,国家优青
分享题目:
ACMix:卷积与注意力模块的高效融合
胡瀚
微软亚洲研究院高级研究经理,西安交通大学兼职博导
分享题目:
Swin Transformer V2:扩展模型容量和分辨率
鲍建敏
微软亚洲研究院主管研究员
分享题目:
CSWin Transformer:基于十字窗口的通用视觉 Transformer 骨干网络
张祥雨
旷视研究院基础模型组负责人
分享题目:
探索大卷积核神经网络设计范式
二、自监督+多模态预训练
主持人:曹越
微软亚洲研究院主管研究员
分享题目:
SimMIM:一种简单的掩码图像建模预训练方法
吴祖煊
复旦大学计算机科学技术学院副研究员,博士生导师
分享题目:
BEVT: BERT Pretraining of Video Transformers
刘蓓
微软亚洲研究院研究员
分享题目:
HD-VILA:大规模高清视频和语言预训练
三、多模态应用
主持人:黄岩
中科院自动化所副研究员
刘洋
北京大学王选计算机研究所研究员,博士生导师
分享题目:
基于高斯候选时间框对比学习的弱监督视频语义定位
唐彦嵩
清华大学深圳国际研究生院助理教授
分享题目:
LAVT:用于指代性物体分割的语言感知视觉 Transformer
于静
中国科学院信息工程研究所副研究员
分享题目:
面向知识型视觉问答的多模态知识抽取与积累
四、3D视觉
主持人:兰旭光
西安交通大学人工智能学院教授,国家杰出青年科学基金获得者
王雁刚
东南大学自动化学院副教授,博士生导师
分享题目:
基于动力学物理约束的人体运动捕捉与重建
陈星宇
快手科技视觉算法研究员
分享题目:
MobRecon:面向移动端的手部三维重建
杨蛟龙
微软亚洲研究院主管研究员
分享题目:
GRAM:基于神经辐射流形的三维可控图像生成
五、图像和视频生成
主持人:陈栋
微软亚洲研究院高级研究经理
分享题目:
基于 VQ-Diffusion 的文本到图像合成
储琪
中国科学技术大学网络空间安全学院副研究员
分享题目:
减少基于 Transformer 的多样性图像修复算法中的信息损失
杨欢
微软亚洲研究院主管研究员
分享题目:
TTVSR:基于轨迹 Transformer 的视频超分辨率网络
六、检测分割
主持人:罗翀
微软亚洲研究院高级研究员,中国科学技术大学和西安交通大学兼职教授、博士生导师
李栋
AMD 北京高级软件研发经理
分享题目:
Dynamic Sparse R-CNN
张磊
粤港澳大湾区数字经济研究院(IDEA)计算机视觉和机器人中心首席科学家,香港科技大学兼职教授
分享题目:
DN-DETR
周三平
西安交通大学人工智能学院助理教授
分享题目:
基于动作与共现特征重构的时序动作定位
王兴刚
华中科技大学电信学院副教授,博士生导师
分享题目:
基于时序高效视觉注意力网络的视频目标分割
点击“阅读原文”,查看详情。