2020
年6月14日-19日,国际计算机视觉与模式识别顶级会议CVPR2020在线上召开虚拟会议。期间,CVPR 2020 UG2+ workshop on “Bridging the Gap Between Computational Photography and Visual Recognition”研讨会及竞赛报告会以云直播的方式于6月19日成功召开,本次研讨会由电气与电子工程师协会(IEEE)主办,CSIG-机器视觉专委会、美国德州农机大学、北京大学、大连理工大学、中科院信工所等联合承办。
美国德州大学Zhangyang Wang博士开场介绍了本次竞赛的赛事情况。他首先对各位专家学者的到来表示热烈的欢迎和衷心的感谢,随后简要介绍了本次研讨会的主体流程,并详细介绍了赛事报名情况,以及邀请嘉宾情况等。本次竞赛主要分为两个不同分赛,分别包括在低见度环境(雾霾天气、夜间、水下环境)拍摄图片的目标检测任务,以及面向FlatCam感光设备的低质量人脸识别。针对两个不同的竞赛分别发布了不同的竞赛数据库和测试任务,旨在弥合计算机摄影和视觉识别之间的差距。超过75个国内外不同单位报名参与了本次竞赛,最后共有8个队伍获得了奖励。
来自美国密西根州立大学的Xiaoming Liu副教授报告了《Monocular 3D Object Detection》的内容。他介绍了一种利用2D和3D透视图的几何关系帮助解决复杂的3D参数估计问题,并进一步介绍了基于深度感知(depth-aware)的卷积层来提取特定位置相关的特征,从而进一步改善网络模型对3D场景的理解能力,并提升单镜头下的三维物体检测准确率。
来自美国佐治亚理工大学的Judy Hoffman助理教授报告了题为《Making Vision Robust to Data and Model Bias》的研究内容。她介绍了一个稳定
可靠系统的设计必须保证对于输入数据扰动的稳定性。在机器学习中,这样的保证需要防止过拟合和确保模型的鲁棒性,防止输入数据损坏。为了最大化稳定性,Judy Hoffman提出了一种基于雅可比正则化的神经网络模型,实现了高效的计算效率,所提出的网络模型的稳定效果和鲁棒性在随机性和对抗性的输入扰动及模型偏差下都可以得到较好的提升,而且不会严重降低干净数据上的泛化特性。
其次,来自美国约翰霍普金斯大学的Vishal M. Patel助理教授进行了题为《Nighttime and Low-light Face Recognition》的报告,主要介绍了在夜间环境或暗光环境下的由于缺乏足够的训练数据而导致的人脸识别挑战性问题。他介绍了现有方法通过利用其它模态人脸辅助的人脸识别方法以及其缺陷问题,然后介绍了一种针对非可见光环境下的,基于人脸内部变化及人脸不变特征进行人脸建模及人脸识别的鲁棒性方法,所提出的方法在夜间和低光照环境下可以得到显著的性能改进。
来自美国俄勒冈大学的Humphrey Shi助理教授进行了题为《The Agriculture-Vision Project》的报告,报告内容主要介绍了深度学习在视觉识别任务,尤其是近年来在农业上的应用也受到了人们的关注。但是目前的农田视觉模式识别缺乏合适的农业图像数据集,计算机视觉与农业科学的融合进展甚微。因此,Shi博士构建了一个用于农业模式语义分割的大规模空中农田图像数据集,所构建的数据集从全美三千多个农田中收集了近十万张高质量的航拍图像并进行了农业模式特定的标注。同时,Shi博士介绍了一种基于新的航空农业模式识别模型,解决了农业视觉对计算机视觉和农业领域提出的几个挑战。
然后,来自英伟达研究院的Zhiding Yu高级研究员做了题为《Learning with Imperfect Labels and Visual Data》的报告。Yu博士介绍了目前的检测模型存在的主要挑战包括:对象实例的区分不够明确、检测器倾向于聚焦于判别性的部分而不是整个物体、候选框冗余量大等问题。针对这些问题,Yu博士介绍了一种弱监督和自训练结合的学习方法,设计了一种实例感知和环境聚焦的统一框架。使用实例感知的自训练算法在多个数据库上取得了更好的结果。
随后,瑞士苏黎世联邦理工大学的Dengxin Dai助理教授介绍了《Increasing Robustness to New Domains and Tasks》的报告内容,主要讲解了存在域间差距时候的模型自适应训练方法,指出目前的方法中,将一个算法扩展到不同场景时需要设计大量的数据采集和标注过程。针对该问题,Dai博士提出了深度框架在域间逐步适应语义分割模型,基于确定性感知的语义分割标注评价框架和度量方法,以及随机图像风格化方法来扩充训练数据集等不同的方法,利用有监督和无监督等不同方式结合的方法,提升不同域间训练模型的鲁棒性,并应用于夜间图像语义分割等实际任务中,不使用夜间图像标注也可以使白天模型适应于夜间,从而改进了目前的技术水平。
最后,来自新加坡南洋理工大学的BIhan Wen助理教授和来自微软云计算与人工智能(Cloud and AI)高级研究员的Xi Yin分别做了题为《Learning Image Models: From Imaging to Computer Vision》和《Object Detection at Scale》的报告,分别介绍了图像恢复、计算成像等之间的关键性问题以及提升目标检测准确度的几种方法。
最后,Zhangyang Wang表示,在低可见环境下,尤其是在雨雾、夜间等常见的现实挑战中所获取图像的退化,导致计算机视觉算法在高层应用系统中无法部署。本次研讨会旨在设计新的计算技术并将其整合到图像采集和成像过程中来解决上述问题,希望各位专家学者和与会观众能在这次竞赛和研讨会的交流中学习知识、汲取灵感,共同为低质量图像内容识别领域的发展助力。