图像语义分割专题
首先,程明明教授介绍了图像语义分割的前沿进展,他的报告题目是《自适应图像语义分割技术》。程教授介绍了图像语义分割技术面临的挑战,并就如何解决这些挑战分享了他的团队在TPAMI 2020和CVPR2020的两个最新工作——富尺度空间的深度神经网络通用架构Res2Net和其应用场景以及自适应的池化方式Strip Pooling。
随后,图像语义分割领域的优秀青年学子分享了他们在CVPR 2020的最新研究成果。中科院自动化所研究生李彦玮报告的题目是Learning Dynamic Routing for Semantic Segmentation,研究了一种在概念上减轻语义表示中尺度差异的新方法,能够根据不同的输入调整不同的路径从而适应输入的尺度分布,称为动态路由结构;北京大学研究生李夏报告的题目是Spatial Pyramid Based Graph Reasoning for Semantic Segmentation,把图卷积网络用在语义分割上,使空间金字塔有可能探索来自不同尺度的多个远程上下文模式;澳大利亚阿德莱德大学博士生陈昊报告的题目是BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation,提出的BlendMask可以通过很少的通道有效地预测密集的每像素位置敏感实例特征,并且仅使用一个卷积层就可以为每个实例学习注意力图,从而可以快速进行推理。
最后,程教授、李彦玮、李夏和陈昊就图像分割领域的数据层面、模型算法层面、应用层面以及未来发展层面的问题进行了精彩的交流分享。
图像语义分割专题集中讨论
跨模态学习专题
清华大学博士生陈辉报告的题目是IMRAM: IMRAM: Iterative Matching with Recurrent Attention Memory for Cross-Modal Image-Text Retrieval,提出了一种带有循环注意力记忆的迭代匹配(IMRAM)方法,该方法通过多步对齐来捕获图像和文本之间的对应关系;中国科学技术大学研究生陆岩报告的题目是Cross-modality Person Re-identification with Shared-Specific Feature Transfer,通过提出一种新颖的跨模态共享特定特征转移算法(称为cm-SSFT)以探索模态共享信息和特定于模态特征的潜力从而促进重新识别;电子科技大学博士生位纪伟报告的题目是Universal Weighting Metric Learning for Cross-Modal Matching,提出一种通用的权重框架,为分析各种损失函数的可解释性提供了一种工具,并在通用加权框架下引入了一个新的多项式损失;中国科学技术大学博士生张攀报告的题目是Cross-Domain Correspondence Learning for Exemplar-Based Image,提供了一个基于示例的图像翻译的通用框架,从给定示例图像的不同域的输入中合成出具有与示例中语义上对应的对象一致样式的逼真图像。
在该专题的集中讨论环节,邓成教授和陈辉、陆岩、位纪伟、张攀就图像分割领域的数据层面、模型算法层面和应用层面分享了自己的理解和经验。
报告会在CSIG机器视觉专委会主任、北京大学林宙辰教授的致辞中闭幕。林教授首先赞扬了程明明、邓成两位教授以及七位同学在语义分割和跨模态学习方面的优秀工作。随后,林教授高度肯定了成本低、效率高、效果好、影响广的云会议、云直播形式,希望以后这种学术报告交流会的形式可以继续推广,使更多的人能参与到前沿知识的分享中。最后,林宙辰教授对参与这次活动的老师、同学、听众、讲者、组织者和直播平台表示了感谢。
此次CSIG-CVPR 2020图像语义分割和跨模态学习专题报告会持续了五个半小时,九位专家讲者既生动展示了两个领域的前沿技术、最新研究成果,又为与会观众开展研究指明了方向。报告会采用云直播的方式,线上参与人气峰值达到2.6万,并进入娱乐小时榜前50。观众通过线上弹幕积极进行互动、交流和提问,专家也给出了详细的解答,极大地鼓舞了大家的科研热情。我们期待更多的优秀青年学子在计算机视觉领域取得研究进展,并在未来的报告会中踊跃参与、共同进步!
感谢极市平台提供直播支持。大会演讲视频将进行适当整理后,向广大学者提供开放录播服务,错过直播的同学可以关注极市平台微信公众号(微信搜索“极市平台”即可),及时获得报告录播回放信息,也可前往B站搜索“极市平台”,观看回放视频。极市平台B站链接:https://space.bilibili.com/85300886