2022年9月24日,中国图象图形学学会(CSIG)机器视觉专委会年度学术会议“第二届CSIG机器视觉与智能研讨会”成功举办,本次活动由中国图象图形学学会(CSIG)主办,CSIG机器视觉专委会、华中科技大学电信学院联合承办。研讨会以线上会议和直播的形式,邀请了陈俊龙教授、龚怡宏教授、黄德双教授、罗笑南教授、李宏亮教授、彭宇新教授、叶齐祥教授、左旺孟教授等八位著名学者来做精彩的专题报告。在专题报告之前,华中科技大学科发院院长廖小飞教授和CSIG机器视觉专委会主任林宙辰教授做领导致辞。本次研讨会主题多样,内容丰富,得到了广泛的关注,线上会议和直播参与人数超过6000人次!
图 1 研讨会开幕合影
图 2 陈俊龙教授报告
来自华南理工大学的陈俊龙教授带来了题为“动态结构神经网络及其应用”的报告。报告指出当前的深度神经网络结构存在训练时间长、容易陷入局部最优解等问题。报告介绍了宽度学习系统(Broad Learning Systems,BLS)。BLS是一种浅层的具有增量学习能力的神经网络,具有快速、高效的优点。报告基于BLS提出了一种具有动态结构的神经网络叠层宽度神经网络(Stacked BLS)。该网络保留了宽度学习系统高效、快速的优点,同时通过残差连接将多个宽度学习系统模块叠加起来,增加网络的深度,提高网络的学习能力。报告在多个主流数据集上验证了该网络的优越性。
图 3 黄德双教授报告
来自同济大学的黄德双教授进行了题为“Graph Representation Learning”的报告。报告首先回顾了神经网络、反向传播发展历史,引出黄教授具有开创性、并对后续深度神经网络发展有很好指导意义的径向基概率神经网络、约束学习算法等方法。随后报告从图经神网络发展的重要里程碑,分析了图神经网络的局限性及最新发展现状,就几个具体问题如图神经网络池化问题、图自监督预训练问题等进行了详细的学术分享及介绍。报告最后对图神经网络的若干关键问题的发展前景进行了展望。
图 4 李宏亮教授报告
来自电子科技大学的李宏亮教授进行了题为“密集人群场景多模态语义分析”的报告。报告主要涉及到密集人群场景下利用多模态进行场景理解和语义分析。报告针对大规模RefCrowd 人体定位数据集深入浅出为大家介绍了多模态密集人群场景的挑战与未来。并进一步将细粒度的人体定位理解任务拓展到更大粒度的人群文本描述场景理解任务,并结合CrowdCaption数据集,与大家共同思考密集人群下多模态任务的发展前景和解决方法。
图 5 叶齐祥教授报告
来自中国科学院的叶齐祥教授为我们带来了题为“小样本增量学习:回顾过去,展望未来”的报告。叶齐祥教授在报告中讲述了目前小样本增量学习的主要挑战为对旧类别的遗忘以及对新类别的过拟合,并介绍了目前学术界对于小样本增量学习的研究。报告中,叶齐祥教授介绍了课题组最新提出的动态支持网络(Dynamic Support Network)提出采用扩增的方式学习新类别的特征表达,同时引入对旧类别特征的回顾,来缓解小样本增量学习中的“遗忘”与“过拟合”的问题。此外叶齐祥教授向大家介绍了另一个创新方法——可学习的分布校准(Learnable Distribution Calibration),提出可学习校准单元实现动态调整类别的分布,使其接近真实的类别分布,在增量学习中,通过分布的校准,降低对旧类别的遗忘,同时可以缓解在新类别上的过拟合。叶教授在最后也向大家介绍了未来的展望,利用Vision Transformer实现更好的分布校准来缓解小样本增量学习中的问题。
图 6 龚怡宏教授报告
来自西安交通大学的龚怡宏教授进行了题为“受脑启发的神经网络计算模型及其泛化性分析”的报告。龚怡宏教授从当前CNN的困境讲起,凝练出了其中的三大科学难题:缺乏可解释性、“纹理偏执”和“灾难性遗忘”。龚怡宏教授的课题组与脑认知科学领域的专家学者进行深层次的合作,基于人脑视觉感知与认知机理的研究成果,提出了ADNet、CogNet、CogNeXt等工作机制清晰、性能优越的新型神经网络,并基于数理分析方法充分验证了模型的泛化性。
图 7 罗笑南教授报告
来自桂林电子科技大学的罗笑南教授进行了题为“人工智能赋能元宇宙”的报告。报告主要涉及元宇宙在现实生活的可能应用,让大家大开眼界。报告从元宇宙的概念及发展讲起,介绍了元宇宙的技术底座,分析了元宇宙的伦理、最新发展现状和挑战,并对产业元宇宙中2d、3d服装设计与仿真关键技术进行介绍。
图 8 彭宇新教授报告
来自北京大学的彭宇新教授带了题为“跨媒体检索与推理近期进展”的报告。报告首先介绍了跨媒体智能的主要任务,分别是跨媒体统一表征理论和模型、跨媒体关联理解与深度挖掘、跨媒体知识图谱构建与学习、跨媒体知识演化与推理、跨媒体描述与生产、跨媒体知识引擎和跨媒体智能应用。报告随后介绍了图像、视频、文本等跨媒体数据具有多源异构、语义抽象、复杂多变等存在于跨媒体智能中的难点。报告针对细粒度图像分类、近似重复视频检索、跨媒体检索和细粒度跨媒体检索进行了详实的介绍,并介绍了后续的研究发展方向。
图 9 左旺孟教授报告
来自哈尔滨工业大学的左旺孟教授进行了题为“全监督图像复原的替代学习方法研究”的报告。报告主要涉及到如何利用没有标签的数据进行图像复原的研究。报告以Raw图ISP和超分辨率为例,介绍颜色不一致和空域配准不精确情况下深度网络的有效学习方法,并拓展到多相机自监督学习、人脸增强技术。通过报告与大家探讨了自然场景复原的未来发展与潜在挑战。
闭幕式上,华中科技大学电信学院刘文予教授做总结发言,并诚挚地邀请各位专家适当时候莅临武汉做线下指导。本次研讨会中,每位教授都给大家带来了精彩且丰富的报告,不仅拓宽了听众的知识广度,同时也增加了听众的知识深度,现场的问题交流与沟通碰撞出不少灵感!此次中国图象图形学学会机器视觉与智能研讨会圆满成功!
来源:CSIG机器视觉专委会