2021模式识别与机器智能前沿研讨会
(线上)
主办单位:中国自动化学会模式识别与机器智能专业委员会(CAA-PRMI)
线上直播地址:https://live.bilibili.com/22300737
(VALSE Webinar直播平台,点击阅读原文即可跳转链接)
会议地点:线上会议
会议时间:2021年10月29日
会议日程
2021年10月29日上午 |
|||
时间 |
内容 |
演讲嘉宾 |
主持人 |
9:00- 9:10 |
领导讲话 |
刘成林 研究员 中科院自动化所 |
|
9:10- 9:50 |
Towards Certified Adversarial Robustness with LipNet |
王立威 教授 北京大学 |
张长水 教授 清华大学 |
9:50- 10:30 |
视觉语义理解的新趋势:从表达学习到跨领域知识融合 |
林倞 教授 中山大学 |
张长水 教授 清华大学 |
10:30- 11:10 |
视觉基础模型及应用 |
鲁继文 副教授 清华大学 |
刘青山 教授 南京信息工程大学 |
11:10- 11:50 |
深度神经网络的压缩与加速研究 |
纪荣嵘 教授 厦门大学 |
刘青山 教授 南京信息工程大学 |
2021年10月29日下午 |
|||
时间 |
内容 |
演讲嘉宾 |
主持人 |
14:00- 14:40 |
面向文档智能理解的视觉信息抽取 |
金连文 教授 华南理工大学 |
林宙辰 教授 北京大学 |
讲者1
演讲嘉宾:王立威 北京大学
报告题目:Towards Certified Adversarial Robustness with LipNet
报告简介:It is well-known that standard neural networks, even with a high classification accuracy, are vulnerable to small ℓ∞-norm bounded adversarial perturbations. Although many attempts have been made, most previous works either can only provide empirical verification of the defense to a particular attack method, or can only develop a certified guarantee of the model robustness in limited scenarios. In this paper, we seek for a new approach to develop a theoretically principled neural network that inherently resists ℓ∞ perturbations. In particular, we design a novel neuron that uses ℓ∞-distance as its basic operation (which we call ℓ∞-dist neuron), and show that any neural network constructed with ℓ∞-dist neurons (called ℓ∞-dist net) is naturally a 1-Lipschitz function with respect to ℓ∞-norm. This directly provides a rigorous guarantee of the certified robustness based on the margin of prediction outputs. We also prove that such networks have enough expressive power to approximate any 1-Lipschitz function with robust generalization guarantee. Our experimental results show that the proposed network is promising. Using ℓ∞-dist nets as the basic building blocks, we consistently achieve state-of-the-art performance on commonly used datasets: 93.09% certified accuracy on MNIST (ϵ=0.3), 79.23% on Fashion MNIST (ϵ=0.1) and 35.10% on CIFAR-10 (ϵ=8/255).
个人简介:王立威,北京大学教授,智能科学系副主任。从事机器学习理论研究。在机器学习国际权威期刊会议发表高水平论文100余篇。担任机器学习与计算机视觉顶级期刊IEEE TPAMI编委。多次担任国际机器学习旗舰会议NeurIPS,ICML,ICLR领域主席与高级领域主席。入选AI’s 10 to Watch,是该奖项自设立以来首位获此荣誉的中国学者。
讲者2
演讲嘉宾:林倞 中山大学
报告题目:视觉语义理解的新趋势:从表达学习到跨领域知识融合
报告简介:计算机视觉长期存在的核心问题包含两个层面:1) 构建能表达丰富多样视觉模式的特征表示;2)面向特定任务(如物体识别)进行分析推理并给出预测。随着深度神经网络技术的出现和持续演化 (例如Transformer的出现),在这两个层面都取得了长足的进步,但也面临着新的挑战。本次报告将针对性地介绍视觉语义理解的趋势和进展,包括:如何降低甚至避免人工标注,利用自监督的方式从图像视频数据中学习特征表示;面对复杂视觉理解任务(例如任务导向的目标定位),如何有效结合常识或者其他来源信息实现高效推理及预测。
个人简介:林倞,中山大学计算机学院教授/博导,国家万人计划青年拔尖人才,国家优秀青年基金获得者,教育部超算工程软件工程研究中心副主任,IET Fellow。先后在美国加州大学洛杉矶分校、香港中文大学等机构工作或访问研究。长期从事面向视觉大数据的语义分析与智能学习相关领域的研究,迄今在国际知名学术期刊与会议上发表论文200余篇,论文被引用接近2万次。获得ICME 2017Best Paper,Pattern Recognition期刊年度最佳论文奖,ICCV 2019最佳论文提名;指导学生获得ACM中国区优秀博士论文奖(每年度2名)、中国计算机学会优秀博士论文奖;作为第一完成人获得2018年度吴文俊人工智能自然科学奖、2019年度中国图像图形学会科学技术一等奖。
讲者3
演讲嘉宾:鲁继文 清华大学
报告题目:视觉基础模型及应用
报告简介:基础模型是近年来人工智能领域的研究热点,在计算机视觉和自然语言处理等领域中取得了卓越的性能,是视觉监控、自动驾驶、智能终端、人机对话等重要应用的关键技术支撑。报告将介绍清华大学智能视觉实验室近年来在视觉基础模型方面所开展的一些工作,包括自监督视觉模型和自注意力视觉模型,以及它们在目标检测、图像分类、物体跟踪、点云补全、视频检索等任务中的应用。
个人简介:鲁继文,清华大学自动化系长聘副教授,国家杰出青年科学基金获得者,IAPR Fellow。主要研究方向为计算机视觉,在PAMI/IJCV/CVPR/ICCV/ECCV上发表论文110余篇,主持承担国家自然科学基金联合重点项目、优秀青年科学基金、国家重点研发计划课题等科研项目10余项,获批国家发明专利40余件,第一完成人获2020年中国电子学会自然科学一等奖。担任国际期刊Pattern Recognition Letters主编,IEEE T-IP/T-CSVT/T-BIOM编委,国际会议ICME2022大会主席,FG2023/VCIP2022/VASS2021/ICME2020程序委员会主席,中国计算机学会计算机视觉专委会和中国人工智能学会模式识别专委会常务委员。指导/联合指导的研究生获中国人工智能学会优秀博士学位论文奖(2人次)、中国图象图形学学会优秀博士学位论文奖和中国电子学会优秀硕士学位论文奖。
讲者4
演讲嘉宾:纪荣嵘 厦门大学
报告题目:深度神经网络的压缩与加速研究
报告简介:深度神经网络在图像理解、语音识别、自然语言处理等人工智能应用领域取得了令人瞩目的成就,成为人工智能研究的热点之一。然而,随着网络性能的不断提高,网络的深度和广度也在不断增加,这就大大增加了网络的参数和计算复杂度。如何压缩和加速这些大的神经网络模型成为学术界和工业界研究的热点。针对神经网络的加速和冗余度问题,本次报告简要介绍已有的加速和压缩方法并在其中覆盖纪荣嵘教授研究组近几年来在神经网络压缩与加速中所做的一些工作与成果。
个人简介:纪荣嵘,厦门大学南强特聘教授,国家杰出青年科学基金获得者。主要研究方向为计算机视觉。近年来发表TPAMI、IJCV、ACM汇刊、IEEE汇刊、CVPR、NeurIPS等会议长⽂过百篇。论文谷歌学术引用万余次。曾获2016年教育部技术发明一等奖、2018年省科技进步一等奖、2019年福建省青年科技奖。曾/现主持国防973项目,国家自然科学基金联合重点基金等项目。任中国计算机学会A类国际会议CVPR和ACM Multimedia领域主席、中国图象图形学学会学术工委副主任、教育部电子信息类教指委人工智能专业建设咨询委员会委员。
讲者5
演讲嘉宾:金连文 华南理工大学
报告题目:面向文档智能理解的视觉信息抽取
报告简介:光学字符识别(OCR)技术在图像理解、信息提取、办公文字处理、智慧教育、金融文档信息处理等诸多领域有着非常广泛的应用。近年来,OCR领域中的文字检测和识别方向已经有很多深入的研究工作和研究成果,但对文档结构化理解的研究报道还不太多。在本次报告中,我将简要回顾视觉富文档信息抽取(VIE)近年来的进展情况,并介绍VIE和文档结构理解领域的一些新方法,包括OCR+VIE端到端新方法、弱监督VIE以及实体匹配相关性辅助VIE方法等,并讨论 VIE 和 OCR 领域值得关注的一些新问题和新方向。
个人简介:金连文,男,于中国科技大学获学士学位、华南理工大学获博士学位,目前为华南理工大学二级教授,兼任中国图像图形学学会(CSIG)常务理事、CSIG文档图像分析与识别专委会主任等学术服务职务。主要研究领域为文字识别、深度学习、计算机视觉及应用等,在IEEE Transactions及重要国际国内学术期刊、
ICDAR/ICFHR/CVPR/AAAI/IJCAI/NeurIPS/ECCV等重要国际会议上发表学术论文200余篇。获省部级科技奖5次(含排名第1的广东省科技进步一等奖1次),指导学生参加国际学术竞赛荣获冠军20余次。
欢迎大家关注我们!
VALSE(Vision and Learning Seminar) 年度研讨会的主要目的是为计算机视觉、图像处理、模式识别与机器学习研究领域内的中国青年学者提供一个深层次学术交流的舞台。